Categories: Ai

RLHF. История становления идеи — 4. HHH: helpful, honest, harmless, Instruct LLM, Constitutional AI

Заканчиваем разбирать части пайплайна RLHF с точки зрения исторической ретроспективы, чтобы понять, как сформировалась идея, которая сегодня лежит в основе самых популярных LLM.

В первой части мы ознакомились с общим пайплайном RLHF, LLM, KL-контролем и необходимостью предобучения на пусть и грязных, но больших данных

Во второй – сравнили Offline RL и Online RL, увидели их ограничения, попробовали имитировать Online RL через self-play и непрерывную обратную связь от среды через Reward Modelling. А еще первый раз задумались о сборе непротиворечивой но достаточно полной обратной связи от человека.

В третьей – добавили этап дообучения с учителем на качественных демонстрациях и осознали важность контроля за сбором человеческой обратной связи.

В этой, финальной части, мы узнаем современное и будто бы общепринятое понятие и определение “согласованной модели” – HHH: helpful, honest, harmless, поиграемся с различными комбинациями RM для представления HHH моделей, а еще увидим, как обогащать и собирать обратную связь не от человека, а от LLM.

Next Как бороться с микроменеджментом в ИТ (и нужно ли) »

Previous « Зачем лабораториям кастомные решения и как мы их создаем

Published by

5 месяцев ago

В Telegram запущен новый дейтинг-сервис Swipy

RLHF. История становления идеи — 4. HHH: helpful, honest, harmless, Instruct LLM, Constitutional AI

Recent Posts

Обзор CMF Buds Pro 2: функциональные TWS-наушники с необычным колёсиком и ChatGPT

Магия CSS на практике: советы по вёрстке от гика. Часть 4

JavaScript: структуры данных и алгоритмы. Часть 5

Реализация событий через HTTP

Каннибализм трафика. Нужно ли вести контекст по брендовым запросам?

Презентация Apple 2024: новая кнопка на iPhone 16, функция слухового аппарата у AirPods, кинокамера в iPhone Pro

RLHF. История становления идеи — 4. HHH: helpful, honest, harmless, Instruct LLM, Constitutional AI

Related Post

Recent Posts

Обзор CMF Buds Pro 2: функциональные TWS-наушники с необычным колёсиком и ChatGPT

Магия CSS на практике: советы по вёрстке от гика. Часть 4

JavaScript: структуры данных и алгоритмы. Часть 5

Реализация событий через HTTP

Каннибализм трафика. Нужно ли вести контекст по брендовым запросам?

Презентация Apple 2024: новая кнопка на iPhone 16, функция слухового аппарата у AirPods, кинокамера в iPhone Pro