Настройка гиперпараметров для RAG

ОГРОМНАЯ проблема при создании приложений LLM заключается в том, что существует слишком много параметров для настройки, и это выходит далеко за рамки подсказок: разбивка на фрагменты, стратегия поиска, метаданные, и это лишь некоторые из них.

  • Теперь вы можете делать это автоматически и эффективно с помощью наших новых ParamTunerабстракций.
  • Определите любую целевую функцию, которую вы хотите (например, конвейер RAG с оценками),
  • Поиск по сетке синхронным или асинхронным способом,
  • поднимитесь на новый уровень с Ray Tune.

У LlamaIndex есть полное руководство по блокноту, показывающее, как оптимизировать пример конвейера RAG с использованием 1) размера фрагмента и 2) top-k.

  1. Настройка: загрузка исходных документов (llama2), определение золотого набора данных,
  2. Целевая функция: определить конвейер RAG для данных, выполнить оценку набора данных и вывести оценку,
  3. Выберите лучший размер top-k/chunk.

Попробуйте и дайте нам знать, что вы думаете!

Предостережения:
⚠️ Это экспериментальный вариант, абстракции могут быть уточнены.
⚠️ По умолчанию выполняется поиск по большой сетке. Остерегайтесь затрат 💵.

См. полное руководство .

Like this post? Please share to your friends:
Llama 2
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: