Базы знаний

Статус: актуально для текущего интерфейса платформы

База знаний помогает собрать документы рабочего пространства в управляемую структуру и использовать их в поиске для ассистентов и workflow-сценариев.

Что такое база знаний

База знаний состоит из:

  • самой базы;
  • папок;
  • документов;
  • настроек доступа;
  • индекса поиска.

Базы знаний используют, когда нужно:

  • централизованно хранить документы команды;
  • подключать один и тот же набор материалов к нескольким ассистентам;
  • отделять доступ к документам по ролям и пользователям;
  • импортировать не только файлы, но и сайт, архивы или структурированные JSON/JSONL данные.

Как создать базу знаний

  1. Откройте раздел База знаний.
  2. Нажмите Создать базу знаний.
  3. Укажите:
    • название;
    • при необходимости описание.
  4. Сохраните базу.

После создания можно сразу:

  • создать папку;
  • создать документ;
  • импортировать файлы;
  • импортировать сайт;
  • открыть настройки доступа.

Как устроена структура

Внутри базы знаний можно хранить:

  • папки;
  • вложенные папки;
  • документы в корне базы;
  • документы внутри папок.

Для просмотра доступны режимы:

  • Дерево;
  • Список;
  • Сетка.

Если документов много, обычно удобно держать базу в режиме дерева, а для быстрого обзора переключаться на список или сетку.

Как добавлять материалы

Ручной документ

Подходит для коротких инструкций, регламентов, заметок и карточек знаний.

Обычно сценарий такой:

  1. Откройте базу.
  2. Нажмите Новый файл или создайте документ из нужной папки.
  3. Заполните название и содержимое.
  4. Сохраните документ.

Импорт файлов

Этот вариант подходит, если у вас уже есть готовые документы.

Поддерживаются основные форматы:

  • PDF;
  • DOC;
  • DOCX;
  • TXT;
  • MD;
  • HTML;
  • CSV;
  • EML;
  • PPTX;
  • XLSX;
  • JSON;
  • JSONL.

Импорт можно запускать:

  • через кнопку загрузки;
  • перетаскиванием файлов в интерфейс базы;
  • пакетной загрузкой нескольких документов.

Подробнее: Файлы, вложения и импорты

Импорт архивов

Если документы уже организованы по папкам, можно загрузить архив:

  • ZIP;
  • RAR;
  • 7z.

При таком импорте платформа старается сохранить исходную структуру папок и документов.

Импорт сайта

Для внешней документации и справочных страниц можно использовать импорт сайта.

Он подходит, если нужно:

  • загрузить одну страницу;
  • обойти раздел сайта;
  • ограничить импорт по доменам и маскам URL;
  • настроить глубину обхода;
  • учитывать robots.txt;
  • импортировать только нужные разделы страницы через селекторы.

Обычно этот режим используют для корпоративной документации, FAQ и витринных сайтов.

Импорт JSON/JSONL

Этот режим нужен, когда данные уже лежат в структурированном виде и их нужно разложить по документам автоматически.

В типовом сценарии вы:

  1. загружаете файл;
  2. смотрите предпросмотр;
  3. задаёте маппинг полей;
  4. настраиваете иерархию;
  5. запускаете импорт.

Это удобно для каталогов, справочников, реестров, CRM-выгрузок и других системных источников.

Индексация и векторизация

Чтобы документ участвовал в поиске, его нужно обработать для retrieval.

Что обычно происходит:

  • текст извлекается из документа;
  • документ разбивается на фрагменты;
  • фрагменты индексируются;
  • после этого документ становится доступен для ассистентов и workflow-сценариев.

Во многих сценариях обработка запускается автоматически, но в интерфейсе также доступна явная операция Векторизовать документ.

Проверяйте состояние индексации, если:

  • ассистент не находит нужный материал;
  • документ только что загружен;
  • документ был существенно изменён после импорта.

Подробнее: RAG и поиск по знаниям

Доступ к базе знаний

У базы знаний есть не только роль доступа по workspace, но и отдельные ограничения на уровне ресурса.

Кнопка Доступ позволяет ограничить:

  • всю базу;
  • конкретную папку;
  • отдельный документ.

Можно задавать правила для:

  • роли;
  • конкретного пользователя.

Уровни доступа:

  • Просмотр;
  • Редактирование;
  • Полный доступ.

Важно:

  • ограничение не расширяет права выше роли workspace, а только сужает доступ;
  • ограничения могут наследоваться от базы к папке и от папки к документам;
  • закрытые документы не должны появляться у пользователей без соответствующего доступа.

Подробнее: Роли и разрешения

Управление содержимым

Внутри базы знаний доступны типовые действия:

  • создание папки;
  • создание документа;
  • переименование;
  • перенос;
  • удаление;
  • настройка иерархии;
  • экспорт документа;
  • ручной запуск векторизации.

Для отдельных документов доступен экспорт в:

  • DOCX;
  • PDF.

Если документ ограничен по доступу, рядом с ним отображается признак закрытого ресурса.

Когда использовать базу знаний, а когда файлы ассистента

Выбирайте базу знаний, если:

  • знания нужны нескольким ассистентам;
  • документы должны жить в папках;
  • доступ нужно разграничивать по ролям и пользователям;
  • контент регулярно обновляется редакторами.

Выбирайте файлы ассистента, если:

  • набор документов нужен только одному ассистенту;
  • не нужна отдельная структура папок;
  • достаточно быстро привязать несколько файлов к конкретному ассистенту.

Подробнее: Ассистенты

Частые проблемы

Ассистент не отвечает по новым документам

Проверьте:

  • завершилась ли обработка документа;
  • не ограничен ли доступ к базе или документу;
  • подключена ли база к нужному ассистенту;
  • сохранены ли настройки ассистента после выбора базы.

После импорта не все документы появились

Чаще всего причина одна из следующих:

  • часть файлов была в неподдерживаемом формате;
  • архив содержал повреждённые файлы;
  • импорт ещё не завершён полностью;
  • для некоторых файлов возникли ошибки извлечения текста.

Пользователь не видит документ

Проверьте сразу два уровня:

  • роль пользователя в workspace;
  • ограничения через кнопку Доступ на базе, папке или документе.

Документ есть, но поиск его не использует

Обычно проблема в одном из пунктов:

  • документ ещё не проиндексирован;
  • после правки не завершилась повторная обработка;
  • ассистент работает с другим набором источников;
  • в workflow-режиме поиск по знаниям не настроен в самом сценарии.

Связанные разделы