Файлы, вложения и импорты
Статус: актуально для текущего интерфейса платформы
В платформе нет одного глобального файлового менеджера. Один и тот же документ может участвовать в разных сценариях, поэтому важно понимать, где именно вы работаете с файлами:
- в чате;
- в ассистенте;
- в базе знаний.
Файлы в чате
Чат поддерживает четыре типа вложений:
- документы;
- изображения;
- аудио;
- видео.
Поддерживаемые форматы для чата:
- документы:
PDF,DOC,DOCX,TXT,XLSX; - изображения:
PNG,JPG,JPEG,GIF,WEBP,BMP,SVG; - аудио:
MP3,WAV,OGG,OPUS,FLAC,AAC,M4A,WMA,AIFF,AMR,CAFи другие поддерживаемые форматы; - видео:
MP4,MOV,MKV,WEBM,AVI,WMV,3GP,TSи другие поддерживаемые форматы.
Как прикрепить файл:
- Откройте нужный диалог.
- Нажмите кнопку со скрепкой.
- Выберите файл или перетащите его в область ввода.
- Дождитесь завершения загрузки.
- Отправьте сообщение.
Лимиты для чата:
- до
50файлов в одном сообщении; - до
100 MBна документ или изображение; - до
500 MBна аудио или видео.
Для аудио и видео платформа может запускать транскрибацию. Результат появляется в чате как отдельный объект, а дальше его можно использовать в диалоге или в действиях ассистента.
Подробнее: Чаты и диалоги
Файлы ассистента
Файлы ассистента загружаются в настройках самого ассистента, в разделе Файлы ассистента.
Этот сценарий нужен, если вы хотите, чтобы конкретный ассистент отвечал по ограниченному набору документов без отдельной базы знаний.
Поддерживаются форматы:
PDF;DOC;DOCX;TXT;XLSX.
Ограничения:
- до
10файлов за одну загрузку; - до
100 MBна один файл.
Статусы файлов ассистента:
- Загружается;
- Обрабатывается;
- Загружен;
- Ошибка.
После сохранения ассистента загруженные файлы начинают участвовать в его поиске по знаниям. Если файл больше не нужен, его можно удалить прямо из списка файлов ассистента.
Подробнее: Ассистенты
Импорт в базу знаний
База знаний поддерживает несколько путей загрузки контента.
Обычные документы
Поддерживаются:
PDF;DOC;DOCX;TXT;MDиMarkdown;HTML;CSV;EML;PPTX;XLSX;JSON;JSONL.
Документы можно:
- загружать с экрана базы знаний;
- перетаскивать в область файлов;
- раскладывать по папкам внутри базы;
- создавать вручную как новый документ.
Архивы
Для массового импорта поддерживаются архивы:
ZIP;RAR;7z.
Архив разворачивается в структуру базы знаний. Если часть файлов не удалось обработать, платформа показывает отдельный отчёт по ошибкам импорта.
Импорт с сайта
Из базы знаний можно:
- импортировать одну страницу по
URL; - запустить краулинг сайта по стартовым адресам.
Для краулинга доступны дополнительные настройки, например:
- список стартовых URL;
- sitemap;
- разрешённые домены;
- include/exclude правила;
- лимиты глубины и количества страниц;
robots.txt;- пользовательские заголовки запроса.
JSON и JSONL
Для JSON и JSONL есть отдельный сценарий импорта:
- Загрузка файла.
- Предварительный анализ структуры.
- Настройка маппинга полей.
- Настройка иерархии документов.
- Запуск импорта.
Этот режим нужен, когда вы загружаете датасет, а не обычный офисный документ.
Подробнее: Базы знаний
Экспорт документов
Файлы и результаты можно выгружать обратно из интерфейса.
Сейчас для пользователя доступны:
- выгрузка документов и результатов в
DOCX; - выгрузка документов и результатов в
PDF.
Экспорт встречается в двух основных местах:
- в сообщениях чата, если ассистент сгенерировал документ или транскрипт;
- в базе знаний при работе с документом.
Что важно помнить
- файл в чате не равен файлу ассистента;
- файл ассистента не равен документу базы знаний;
- один и тот же исходный документ может использоваться в разных местах по-разному;
- для поиска по знаниям важна не только загрузка, но и готовность обработки или индексации.
Частые проблемы
Файл не прикрепляется в чат
Проверьте:
- формат файла;
- размер файла;
- лимит количества файлов в сообщении;
- права на загрузку вложений в текущем рабочем пространстве.
Файл ассистента загрузился, но ассистент отвечает без него
Обычно причина одна из двух:
- ассистент ещё не сохранён или файл не завершил обработку;
- у ассистента не настроены источники знаний так, как вы ожидаете.
Импорт в базу знаний завершился частично
Это штатный сценарий для архива или смешанного набора файлов. Откройте карточку импорта и проверьте, какие элементы пропущены и почему.