Базы знаний
Статус: актуально для текущего интерфейса платформы
База знаний помогает собрать документы рабочего пространства в управляемую структуру и использовать их в поиске для ассистентов и workflow-сценариев.
Что такое база знаний
База знаний состоит из:
- самой базы;
- папок;
- документов;
- настроек доступа;
- индекса поиска.
Базы знаний используют, когда нужно:
- централизованно хранить документы команды;
- подключать один и тот же набор материалов к нескольким ассистентам;
- отделять доступ к документам по ролям и пользователям;
- импортировать не только файлы, но и сайт, архивы или структурированные
JSON/JSONLданные.
Как создать базу знаний
- Откройте раздел База знаний.
- Нажмите Создать базу знаний.
- Укажите:
- название;
- при необходимости описание.
- Сохраните базу.
После создания можно сразу:
- создать папку;
- создать документ;
- импортировать файлы;
- импортировать сайт;
- открыть настройки доступа.
Как устроена структура
Внутри базы знаний можно хранить:
- папки;
- вложенные папки;
- документы в корне базы;
- документы внутри папок.
Для просмотра доступны режимы:
- Дерево;
- Список;
- Сетка.
Если документов много, обычно удобно держать базу в режиме дерева, а для быстрого обзора переключаться на список или сетку.
Как добавлять материалы
Ручной документ
Подходит для коротких инструкций, регламентов, заметок и карточек знаний.
Обычно сценарий такой:
- Откройте базу.
- Нажмите Новый файл или создайте документ из нужной папки.
- Заполните название и содержимое.
- Сохраните документ.
Импорт файлов
Этот вариант подходит, если у вас уже есть готовые документы.
Поддерживаются основные форматы:
PDF;DOC;DOCX;TXT;MD;HTML;CSV;EML;PPTX;XLSX;JSON;JSONL.
Импорт можно запускать:
- через кнопку загрузки;
- перетаскиванием файлов в интерфейс базы;
- пакетной загрузкой нескольких документов.
Подробнее: Файлы, вложения и импорты
Импорт архивов
Если документы уже организованы по папкам, можно загрузить архив:
ZIP;RAR;7z.
При таком импорте платформа старается сохранить исходную структуру папок и документов.
Импорт сайта
Для внешней документации и справочных страниц можно использовать импорт сайта.
Он подходит, если нужно:
- загрузить одну страницу;
- обойти раздел сайта;
- ограничить импорт по доменам и маскам URL;
- настроить глубину обхода;
- учитывать
robots.txt; - импортировать только нужные разделы страницы через селекторы.
Обычно этот режим используют для корпоративной документации, FAQ и витринных сайтов.
Импорт JSON/JSONL
Этот режим нужен, когда данные уже лежат в структурированном виде и их нужно разложить по документам автоматически.
В типовом сценарии вы:
- загружаете файл;
- смотрите предпросмотр;
- задаёте маппинг полей;
- настраиваете иерархию;
- запускаете импорт.
Это удобно для каталогов, справочников, реестров, CRM-выгрузок и других системных источников.
Индексация и векторизация
Чтобы документ участвовал в поиске, его нужно обработать для retrieval.
Что обычно происходит:
- текст извлекается из документа;
- документ разбивается на фрагменты;
- фрагменты индексируются;
- после этого документ становится доступен для ассистентов и workflow-сценариев.
Во многих сценариях обработка запускается автоматически, но в интерфейсе также доступна явная операция Векторизовать документ.
Проверяйте состояние индексации, если:
- ассистент не находит нужный материал;
- документ только что загружен;
- документ был существенно изменён после импорта.
Подробнее: RAG и поиск по знаниям
Доступ к базе знаний
У базы знаний есть не только роль доступа по workspace, но и отдельные ограничения на уровне ресурса.
Кнопка Доступ позволяет ограничить:
- всю базу;
- конкретную папку;
- отдельный документ.
Можно задавать правила для:
- роли;
- конкретного пользователя.
Уровни доступа:
- Просмотр;
- Редактирование;
- Полный доступ.
Важно:
- ограничение не расширяет права выше роли workspace, а только сужает доступ;
- ограничения могут наследоваться от базы к папке и от папки к документам;
- закрытые документы не должны появляться у пользователей без соответствующего доступа.
Подробнее: Роли и разрешения
Управление содержимым
Внутри базы знаний доступны типовые действия:
- создание папки;
- создание документа;
- переименование;
- перенос;
- удаление;
- настройка иерархии;
- экспорт документа;
- ручной запуск векторизации.
Для отдельных документов доступен экспорт в:
DOCX;PDF.
Если документ ограничен по доступу, рядом с ним отображается признак закрытого ресурса.
Когда использовать базу знаний, а когда файлы ассистента
Выбирайте базу знаний, если:
- знания нужны нескольким ассистентам;
- документы должны жить в папках;
- доступ нужно разграничивать по ролям и пользователям;
- контент регулярно обновляется редакторами.
Выбирайте файлы ассистента, если:
- набор документов нужен только одному ассистенту;
- не нужна отдельная структура папок;
- достаточно быстро привязать несколько файлов к конкретному ассистенту.
Подробнее: Ассистенты
Частые проблемы
Ассистент не отвечает по новым документам
Проверьте:
- завершилась ли обработка документа;
- не ограничен ли доступ к базе или документу;
- подключена ли база к нужному ассистенту;
- сохранены ли настройки ассистента после выбора базы.
После импорта не все документы появились
Чаще всего причина одна из следующих:
- часть файлов была в неподдерживаемом формате;
- архив содержал повреждённые файлы;
- импорт ещё не завершён полностью;
- для некоторых файлов возникли ошибки извлечения текста.
Пользователь не видит документ
Проверьте сразу два уровня:
- роль пользователя в workspace;
- ограничения через кнопку Доступ на базе, папке или документе.
Документ есть, но поиск его не использует
Обычно проблема в одном из пунктов:
- документ ещё не проиндексирован;
- после правки не завершилась повторная обработка;
- ассистент работает с другим набором источников;
- в workflow-режиме поиск по знаниям не настроен в самом сценарии.