Дослідники з Массачусетського технологічного інституту (MIT) знайшли спосіб підвищити адаптивність великих мовних моделей (LLM) за допомогою техніки, що називається тестове навчання. Цей метод дозволяє моделям значно покращити свою точність на незнайомих та складних завданнях, таких як медична діагностика або управління ланцюгами поставок.
Інноваційний підхід до навчання
Тестове навчання дозволяє тимчасово оновлювати внутрішні параметри моделі під час її використання. Це забезпечує шестикратне підвищення точності у порівнянні з традиційними методами, такими як навчання в контексті. Дослідження показало, що цей підхід особливо ефективний на завданнях, які вимагають логічного висновку та абстрактного мислення.
Цей інноваційний підхід до навчання на прикладі нових завдань створює можливості для розвитку моделей, які можуть автоматично визначати, коли використовувати тестове навчання для оптимізації своїх результатів. Це може значно розширити сфери застосування мовних моделей у різних галузях.









