LLM Провайдеры
Версия: 1.62
LLM (Large Language Model) провайдер - это сервис, предоставляющий доступ к языковым моделям для генерации ответов AI.
Содержание
- Что такое LLM провайдер
- Настройка провайдера (для администраторов)
- Выбор провайдера в ассистенте
- Приоритет выбора провайдера
- Настройка модели
- Параметры генерации
- Типы провайдеров
- Частые проблемы
Что такое LLM провайдер
LLM провайдер - это сервис, который:
- Предоставляет доступ к языковым моделям (GigaChat, OpenAI, Claude и др.)
- Обрабатывает запросы на генерацию текста
- Возвращает ответы в реальном времени (streaming)
- Учитывает параметры генерации (temperature, maxTokens и др.)
Зачем нужны провайдеры
- Разные модели - разные провайдеры предоставляют разные модели
- Гибкость - можно выбрать подходящую модель для задачи
- Резервирование - можно настроить несколько провайдеров для отказоустойчивости
- Стоимость - разные провайдеры имеют разную стоимость использования
Настройка провайдера (для администраторов)
Требования: Для настройки провайдеров нужна роль администратора.
Создание провайдера
- Перейдите в Администрирование → LLM Провайдеры
- Нажмите кнопку "Создать провайдер" или "+"
- Заполните информацию:
- Тип провайдера - GigaChat, Custom, AITunnel
- Название - название провайдера
- Описание - краткое описание
- Настройте подключение:
- Token URL - URL для получения токена (для OAuth)
- Completion URL - URL для отправки запросов
- Authorization Key - ключ авторизации
- Scope - область доступа (для OAuth)
- Настройте модель:
- Модель - выберите модель из списка
- Доступные модели - список моделей для выбора
- Настройте параметры запроса:
- Request Headers - дополнительные заголовки (JSON)
- System Prompt - системный промпт по умолчанию
- Temperature - креативность по умолчанию
- Max Tokens - максимальная длина ответа
- Top P - параметр ядра выборки
- Presence Penalty - штраф за присутствие токенов
- Frequency Penalty - штраф за частоту токенов
- Настройте флаги:
- Активен - провайдер доступен для использования
- Глобальный - провайдер доступен для всех workspace
- Разрешить самоподписанные сертификаты - для тестовых серверов
- Нажмите "Создать"
Редактирование провайдера
- Найдите провайдер в списке
- Нажмите кнопку "Редактировать" (иконка карандаша)
- Внесите необходимые изменения
- Нажмите "Сохранить"
Активация/деактивация провайдера
- Найдите провайдер в списке
- Переключите флаг "Активен"
- Изменения сохраняются автоматически
Важно: Деактивированный провайдер не будет использоваться в ассистентах.
Выбор провайдера в ассистенте
Пользователи могут выбрать провайдер для конкретного ассистента.
Как выбрать
- Откройте настройки ассистента
- Найдите раздел "LLM настройки" или "AI настройки"
- В поле "LLM Провайдер" выберите провайдера из списка
- Сохраните изменения
Доступные провайдеры:
- Провайдеры, доступные в рабочем пространстве
- Глобальные провайдеры (если настроены администратором)
- Провайдеры workspace (если настроены)
Приоритет выбора провайдера
При использовании ассистента провайдер выбирается по следующему приоритету:
- Провайдер ассистента - если указан в настройках ассистента
- Провайдер workspace - если не указан провайдер ассистента, используется провайдер из настроек Unica Chat workspace
- Глобальный провайдер - если не указан провайдер workspace, используется глобальный провайдер
Настройка провайдера workspace
- Перейдите в Администрирование → LLM Провайдеры
- Найдите раздел "Unica Chat Config"
- Выберите провайдер из списка
- Настройте модель и параметры (опционально)
- Сохраните изменения
Этот провайдер будет использоваться по умолчанию для всех ассистентов в workspace, если не указан провайдер ассистента.
Настройка модели
Модель определяет конкретную версию языковой модели для использования.
Выбор модели в провайдере
При создании или редактировании провайдера:
- В поле "Модель" выберите модель из списка доступных
- Или введите название модели вручную
- Сохраните изменения
Выбор модели в ассистенте
- В настройках ассистента найдите поле "Модель"
- Выберите модель из списка доступных для выбранного провайдера
- Или оставьте пустым для использования модели по умолчанию провайдера
- Сохраните изменения
Доступные модели
Доступные модели зависят от типа провайдера:
- GigaChat: GigaChat-Pro, GigaChat, GigaChat-Lite
- AITunnel: GPT-5.1 Chat, GPT-5 Mini, GPT-4.1, Claude 3.7 Sonnet, Gemini 2.5 Pro и др.
- Custom: зависит от настроек провайдера
Параметры генерации
Важно: Начиная с версии 1.62 параметры генерации LLM управляются из одного места — настройки ассистента → «Расширенные параметры». Настройки в провайдере работают как ограничители, а не как значения по умолчанию для ассистентов.
Роль провайдера: ограничитель (ceiling)
Параметр Max Tokens в настройках провайдера задаёт максимально допустимый лимит для всех ассистентов, которые используют этот провайдер. Если в ассистенте указано значение выше лимита провайдера — оно автоматически обрезается до значения провайдера.
Пример: провайдер ограничен 8000 токенов, ассистент настроен на 16000 → в запросе к LLM будет передано 8000.
Параметры в форме провайдера
Набор доступных параметров зависит от типа провайдера:
Для Unica AI — только:
- Лимит токенов (максимум) — потолок для всех ассистентов этого провайдера
- Системный промпт — инструкция для LLM по умолчанию
- Расширенные параметры запроса (JSON) — дополнительные поля тела запроса (workspace_id и др.)
Для других типов (GigaChat, AITunnel, Custom) — дополнительно:
- Temperature — креативность (0.0–2.0)
- Top P — ядро выборки (0.0–1.0)
- Presence Penalty — штраф за повторение тем (-2.0 до 2.0)
- Frequency Penalty — штраф за повторение токенов (-2.0 до 2.0)
Управление параметрами генерации в ассистенте
Все тонкие настройки генерации задаются в ассистенте через блок «Расширенные параметры». Пустое поле означает «использовать значение провайдера».
Подробнее: Ассистенты → Расширенные параметры LLM
Temperature (Креативность)
Контролирует случайность ответов.
- Диапазон: 0.0–2.0
- По умолчанию: 0.2 (системный дефолт)
- Низкое значение (0.1–0.3): более точные, детерминированные ответы
- Среднее значение (0.5–0.7): баланс между точностью и креативностью
- Высокое значение (0.8–1.0): более креативные, разнообразные ответы
Настраивается в ассистенте. Для Unica AI провайдеров: не задаётся в провайдере.
Max Tokens (Максимальная длина / Лимит)
Максимальное количество токенов в ответе.
- В провайдере: задаёт потолок — ассистент не может превысить это значение
- В ассистенте: задаёт желаемое значение (но не выше лимита провайдера)
- По умолчанию: 4096 (системный дефолт)
Top P, Presence Penalty, Frequency Penalty
Доступны только в настройках провайдеров типа GigaChat, AITunnel, Custom. Для Unica AI — настраиваются исключительно через ассистент.
- Top P: 0.0–1.0 (ядро выборки)
- Presence Penalty: -2.0 до 2.0 (штраф за повторение тем)
- Frequency Penalty: -2.0 до 2.0 (штраф за повторение токенов)
Типы провайдеров
GigaChat
Провайдер от Сбера, предоставляющий доступ к моделям GigaChat.
Особенности:
- OAuth авторизация
- Поддержка streaming
- Российский провайдер
Настройка:
- Token URL:
https://ngw.devices.sberbank.ru:9443/api/v2/oauth - Completion URL:
https://gigachat.devices.sberbank.ru/api/v1/chat/completions - Scope:
GIGACHAT_API_PERS
AITunnel
Провайдер, предоставляющий единый API для доступа к различным моделям (OpenAI, DeepSeek, Claude, Gemini).
Особенности:
- Единый API для разных моделей
- Поддержка множества моделей
- Простая настройка
Настройка:
- Completion URL:
https://api.aitunnel.ru/v1/chat/completions - Authorization Key: API ключ от AITunnel
Unica AI
Внутренний провайдер на базе Unica AI.
Особенности:
- Не требует API ключа
- Не требует Token URL и Scope
- Параметры генерации (temperature, top_p и др.) настраиваются только через ассистент
- В форме провайдера доступны: лимит токенов (потолок), системный промпт, расширенные параметры (JSON)
Настройка:
- Completion URL: адрес Unica AI сервиса
- Лимит токенов: максимум для всех ассистентов этого провайдера
- Расширенные параметры (JSON):
{"workspace_id": "GENERAL"}(обязательно)
Custom
Кастомный провайдер для подключения любых совместимых API.
Особенности:
- Гибкая настройка
- Поддержка любых совместимых API
- Кастомные заголовки и параметры
Настройка:
- Укажите Token URL и Completion URL вашего API
- Настройте Authorization Key
- Настройте Request Headers при необходимости
Частые проблемы
Провайдер не работает
Проблема: Провайдер настроен, но не отвечает на запросы.
Возможные причины:
- Провайдер неактивен
- Неправильные URL или ключи
- Проблемы с сетью
- Провайдер недоступен
Решение:
- Проверьте, что провайдер активен
- Проверьте правильность URL и ключей
- Проверьте подключение к интернету
- Проверьте статус провайдера на его стороне
Не могу выбрать провайдер в ассистенте
Проблема: В списке провайдеров нет нужного провайдера.
Возможные причины:
- Провайдер неактивен
- Провайдер не доступен в рабочем пространстве
- Провайдер не глобальный и не привязан к workspace
Решение:
- Проверьте, что провайдер активен
- Убедитесь, что провайдер доступен в вашем workspace
- Обратитесь к администратору для настройки провайдера
Ошибки авторизации
Проблема: Появляются ошибки авторизации при использовании провайдера.
Возможные причины:
- Неправильный Authorization Key
- Истёкший токен (для OAuth)
- Неправильный Scope (для OAuth)
Решение:
- Проверьте правильность Authorization Key
- Для OAuth провайдеров проверьте настройки Token URL и Scope
- Обновите ключи при необходимости
Медленные ответы
Проблема: Провайдер отвечает медленно.
Возможные причины:
- Перегрузка провайдера
- Проблемы с сетью
- Большой Max Tokens
- Сложный запрос
Решение:
- Подождите немного (провайдер может быть перегружен)
- Проверьте подключение к интернету
- Уменьшите Max Tokens
- Упростите запрос
Связанные разделы
- Ассистенты - настройка провайдера в ассистенте
- RAG и векторный поиск - использование провайдеров в RAG
- Административная панель - управление провайдерами
Примечания
- Версия: 1.62
- Настройка: Только для администраторов
- Приоритет: Провайдер ассистента → Провайдер workspace → Глобальный провайдер
- Параметры генерации: Управляются в ассистенте → «Расширенные параметры»; провайдер задаёт только потолок по maxTokens
- Безопасность: Ключи авторизации хранятся в зашифрованном виде