Представляем вам Фабрис ИИ

Fabrice AI — это цифровое представление моих мыслей, основанное на всем содержимом моего блога. Он задуман как интерактивный, интеллектуальный помощник, способный понимать сложные запросы и отвечать на них с тонкостью и точностью.

Fabrice AI начался как эксперимент, личное стремление исследовать потенциал искусственного интеллекта путем создания цифровой версии обширных знаний, которыми я делился на протяжении многих лет. Изначально я представлял себе это как простой проект, который можно завершить за несколько часов. План был прост: загрузить мои материалы в API OpenAI и позволить искусственному интеллекту взаимодействовать с ними, создав таким образом доступного интеллектуального помощника, способного давать развернутые ответы на основе богатой информации, которой я поделился.

Однако, когда я отправился в это путешествие, быстро выяснилось, что задача оказалась гораздо сложнее, чем я предполагал. Проект, который, как я думал, будет кратким знакомством с искусственным интеллектом, быстро превратился во всеобъемлющее и сложное мероприятие, требующее гораздо большего, чем просто поверхностная загрузка данных. Это превратилось в глубокое погружение в тонкости ИИ, обработки естественного языка и управления знаниями.

Основная проблема, с которой я столкнулся, заключалась не только в хранении информации, но и в том, чтобы научить ИИ понимать, контекстуализировать и точно извлекать эту информацию таким образом, чтобы она отражала глубину и нюансы моего оригинального контента. Это потребовало многогранного подхода, поскольку я обнаружил, что простых методов хранения и поиска данных недостаточно для решения сложных вопросов, с которыми я хотел, чтобы справился ИИ Fabrice.

Это путешествие привело меня к широкому спектру подходов, начиная с первых попыток использования векторных поисковых индексов и заканчивая более продвинутыми методами, включающими графы знаний, поиск по метаданным и созданные на заказ модели ИИ. У каждого подхода был свой набор сильных и слабых сторон, и каждый научил меня чему-то новому о сложностях ИИ и нюансах управления цифровыми знаниями. Я подробно опишу пройденный технический путь в следующей записи блога.

Помимо технических проблем, создание исчерпывающей базы знаний также оказалось непростой задачей. На ранних этапах тестирования точности ИИ меня осенило, что наиболее подробные и точные ответы на некоторые вопросы я давал в видеоинтервью или подкастах. Чтобы быть точным, мне нужно было, чтобы база знаний включала все мои посты, видеоинтервью, подкасты, презентации PowerPoint, изображения и документы PDF.

Я начал с расшифровки всего содержимого. Учитывая, что автоматические транскрипции изначально являются приблизительными, мне нужно было убедиться, что ИИ понимает содержание. Это заняло много времени, поскольку мне пришлось проверять ответы на каждый фрагмент расшифрованного контента.

Несмотря на то, что транскрипция отделяла меня от другого диктора, ИИ сначала считал, что 100% произносимого контента принадлежит мне, что потребовало дополнительного обучения, чтобы убедиться, что он может правильно различать обоих дикторов на всем контенте. Я также хотел, чтобы ИИ Fabrice придавал большее значение недавнему контенту. Конечно, когда я попробовал сделать это в первый раз, он использовал дату, когда я загрузил контент на LLM, а не дату, когда я первоначально разместил статью, что потребовало дальнейших корректировок.

Для полноты картины я также расшифровал знания, содержащиеся в слайдах, которыми я поделился в блоге, используя модель OCR в Azure для преобразования изображений в текст, а затем загрузил файлы в базу знаний помощника GPT. Аналогичным образом я загрузил PDF-файлы из медиатеки WordPress и поместил их в базу знаний.

Во время бета-тестирования я заметил, что многие мои друзья задавали личные вопросы, которые не были освещены в блоге. Я жду, чтобы увидеть, какие вопросы будут задавать люди в течение следующих нескольких недель. Я буду дополнять ответы в том случае, если их нельзя будет найти в существующем контенте моего блога. Обратите внимание, что я намеренно ограничиваю ответы Fabrice AI контентом в блоге, поэтому Вы действительно получаете Fabrice AI, а не смесь Fabrice AI и Chat GPT.

Стоит отметить, что я прошел долгий путь, чтобы добраться до этого места. Я начал с использования GPT3, но был разочарован результатами. Он продолжал использовать неправильные источники для ответов на вопросы, даже если некоторые записи в блогах содержали именно тот ответ, который был задан в вопросе. Несмотря на десятки часов работы над проблемой, пытаясь заставить его использовать правильный контент (о чем я расскажу в следующей статье в блоге), я так и не получил результатов, которые меня устраивали.

В GPT3.5 ситуация улучшилась, но все равно была разочаровывающей. Затем я создал GPT-приложение в GPT Store с помощью GPT Builder. Оно работало немного лучше и было дешевле в эксплуатации. Однако я не смог заставить его работать на моем сайте, и оно было доступно только для платных подписчиков Chat GPT, что, на мой взгляд, было слишком ограничивающим фактором. В любом случае, мне не нравилось качество ответов, и мне было неудобно выпускать его в открытый доступ.

Прорыв произошел с выходом GPT Assistants, использующего модель 4o. Мне не нужно было указывать ему, какой контент использовать, он просто начал разбираться сам, и все стало работать лучше. Я отказался от подхода GPT-приложения и вернулся к использованию API, чтобы иметь возможность встраивать его в блог. Для полноты картины я также протестировал Gemini, но предпочел ответы, данные GPT4o.

Пока что я выпускаю версию только для текстовых вопросов. Она включает в себя функцию преобразования голоса в текст, так что Вы сможете задавать свои вопросы голосом. Я размышляю над тем, как создать интерактивную версию, которая будет выглядеть и звучать как я, и с которой Вы сможете вести беседу. У меня есть рабочий прототип, но я далеко не в восторге от результатов и потенциальной стоимости. Я хочу быть уверен, что он говорит от первого лица, действительно выглядит и звучит как я, и не будет стоить мне руки и ноги.

Посмотрим, какого прогресса я добьюсь в ближайшие месяцы, но, возможно, имеет смысл подождать GPT5. Оглядываясь назад, я бы сэкономил сотни часов работы, если бы просто дождался GPT4o, чтобы разработать Fabrice AI. Но, опять же, исследование было частью смысла, и это было очень интересно.

А пока, пожалуйста, поиграйте с Fabrice AI и дайте мне знать, что Вы думаете!