Embedding Провайдеры
Версия: 1.59
Embedding провайдер - это сервис, предоставляющий модели для векторизации текста. Используется для индексации документов и векторизации запросов в RAG.
Содержание
- Что такое embedding провайдер
- Настройка провайдера (для администраторов)
- Использование в индексации документов
- Использование в RAG поиске
- Использование в файлах ассистента
- Частые проблемы
Что такое embedding провайдер
Embedding провайдер - это сервис, который:
- Векторизует текст - преобразует текст в числовой вектор (embedding)
- Используется для индексации - векторизует документы при индексации
- Используется в RAG - векторизует запросы пользователей для поиска
- Обеспечивает семантический поиск - позволяет находить документы по смыслу
Зачем нужны провайдеры
- Разные модели - разные провайдеры предоставляют разные модели векторизации
- Качество поиска - качество embedding влияет на точность поиска
- Производительность - разные модели имеют разную скорость и стоимость
- Гибкость - можно выбрать подходящую модель для задачи
Настройка провайдера (для администраторов)
Требования: Для настройки провайдеров нужна роль администратора.
Создание провайдера
- Перейдите в Администрирование → Embedding Провайдеры
- Нажмите кнопку "Создать провайдер" или "+"
- Заполните информацию:
- Тип провайдера - GigaChat, Custom
- Название - название провайдера
- Описание - краткое описание
- Настройте подключение:
- Token URL - URL для получения токена (для OAuth)
- Embeddings URL - URL для отправки запросов на векторизацию
- Authorization Key - ключ авторизации
- Scope - область доступа (для OAuth)
- Настройте модель:
- Модель - название модели для векторизации
- Max Tokens Per Vectorization - максимальное количество токенов за один запрос
- Настройте дополнительные параметры:
- Request Headers - дополнительные заголовки (JSON)
- Разрешить самоподписанные сертификаты - для тестовых серверов
- Настройте флаги:
- Активен - провайдер доступен для использования
- Глобальный - провайдер доступен для всех workspace
- Нажмите "Создать"
Редактирование провайдера
- Найдите провайдер в списке
- Нажмите кнопку "Редактировать" (иконка карандаша)
- Внесите необходимые изменения
- Нажмите "Сохранить"
Тестирование провайдера
- Найдите провайдер в списке
- Нажмите кнопку "Тестировать" или "Проверить подключение"
- Система проверит:
- Получение access token (для OAuth)
- Запрос векторизации тестового текста
- Обработку ответа
- Результаты тестирования отобразятся с деталями каждого шага
Активация/деактивация провайдера
- Найдите провайдер в списке
- Переключите флаг "Активен"
- Изменения сохраняются автоматически
Важно: Деактивированный провайдер не будет использоваться для индексации и поиска.
Использование в индексации документов
Embedding провайдер используется для векторизации документов при индексации.
Процесс индексации
- Извлечение текста - текст извлекается из документа
- Чанкинг - документ разбивается на фрагменты (чанки)
- Векторизация - каждый чанк векторизуется с помощью embedding провайдера
- Сохранение - векторы сохраняются в Qdrant
Выбор провайдера
Провайдер выбирается автоматически:
- Провайдер workspace - если настроен для рабочего пространства
- Глобальный провайдер - если не настроен провайдер workspace
Настройка провайдера для workspace
- Перейдите в Администрирование → Embedding Провайдеры
- Создайте или выберите провайдер
- Убедитесь, что провайдер привязан к нужному workspace
- Активируйте провайдер
Важно: Провайдер должен быть активен для использования в индексации.
Использование в RAG поиске
Embedding провайдер используется для векторизации запросов пользователей в RAG.
Процесс поиска
- Запрос пользователя - пользователь отправляет запрос
- Векторизация запроса - запрос векторизуется с помощью embedding провайдера
- Поиск в Qdrant - вектор запроса сравнивается с векторами документов
- Ранжирование - результаты ранжируются по релевантности
Выбор провайдера
Провайдер выбирается в следующем порядке:
- Провайдер ассистента - если указан в настройках ассистента (RAG настройки)
- Провайдер workspace - если не указан провайдер ассистента
- Глобальный провайдер - если не настроен провайдер workspace
Настройка провайдера в ассистенте
- Откройте настройки ассистента
- Найдите раздел "RAG настройки"
- В поле "Embedding Провайдер" выберите провайдера из списка
- Сохраните изменения
Важно: Провайдер должен быть активен и доступен в рабочем пространстве.
Использование в файлах ассистента
Embedding провайдер используется для векторизации файлов ассистента в LLM режиме.
Процесс обработки
- Загрузка файла - файл загружается в ассистент
- Извлечение текста - текст извлекается из файла
- Чанкинг - документ разбивается на фрагменты
- Векторизация - каждый чанк векторизуется с помощью embedding провайдера
- Сохранение - векторы сохраняются в Qdrant
Выбор провайдера
Провайдер выбирается автоматически:
- Провайдер workspace - если настроен для рабочего пространства
- Глобальный провайдер - если не настроен провайдер workspace
Важно: Провайдер должен быть активен для использования в индексации файлов.
Частые проблемы
Провайдер не работает
Проблема: Провайдер настроен, но не отвечает на запросы.
Возможные причины:
- Провайдер неактивен
- Неправильные URL или ключи
- Проблемы с сетью
- Провайдер недоступен
Решение:
- Проверьте, что провайдер активен
- Проверьте правильность URL и ключей
- Используйте функцию "Тестировать" для проверки подключения
- Проверьте подключение к интернету
- Проверьте статус провайдера на его стороне
Индексация не работает
Проблема: Документы не индексируются.
Возможные причины:
- Нет активного embedding провайдера
- Провайдер не доступен в рабочем пространстве
- Проблемы с провайдером
Решение:
- Убедитесь, что есть активный embedding провайдер
- Проверьте, что провайдер доступен в вашем workspace
- Проверьте статус провайдера
- Попробуйте запустить индексацию вручную
Поиск не находит документы
Проблема: RAG поиск не находит релевантные документы.
Возможные причины:
- Документы не проиндексированы
- Используется другой embedding провайдер для поиска, чем для индексации
- Проблемы с качеством векторизации
Решение:
- Убедитесь, что документы проиндексированы
- Используйте тот же embedding провайдер для индексации и поиска
- Проверьте качество векторизации (можно протестировать провайдер)
Медленная векторизация
Проблема: Векторизация работает медленно.
Возможные причины:
- Перегрузка провайдера
- Проблемы с сетью
- Большой объём текста
- Неоптимальные настройки
Решение:
- Подождите немного (провайдер может быть перегружен)
- Проверьте подключение к интернету
- Уменьшите размер чанков
- Проверьте настройки Max Tokens Per Vectorization
Ошибки авторизации
Проблема: Появляются ошибки авторизации при использовании провайдера.
Возможные причины:
- Неправильный Authorization Key
- Истёкший токен (для OAuth)
- Неправильный Scope (для OAuth)
Решение:
- Проверьте правильность Authorization Key
- Для OAuth провайдеров проверьте настройки Token URL и Scope
- Обновите ключи при необходимости
- Используйте функцию "Тестировать" для диагностики
Связанные разделы
- RAG и векторный поиск - использование провайдеров в RAG
- Базы знаний - индексация документов с помощью провайдеров
- Ассистенты - настройка провайдера в ассистенте
- Административная панель - управление провайдерами
Примечания
- Версия: 1.59
- Настройка: Только для администраторов
- Использование: Автоматически для индексации и поиска
- Безопасность: Ключи авторизации хранятся в зашифрованном виде
- Важно: Используйте тот же провайдер для индексации и поиска для оптимальных результатов