ファブリスAIの紹介

Fabrice AIは、私のブログの全コンテンツに基づき、私の考えをデジタルで表現したものです。 これは、複雑なクエリを理解し、ニュアンスと正確さをもって応答することができる、対話型のインテリジェントなアシスタントであることを意図している。

Fabrice AIは、私が長年にわたって共有してきた広範な知識のデジタル版を作ることで、人工知能の可能性を探るという個人的な探求、実験から始まった。 当初、私はこれを簡単なプロジェクトとして、数時間で完成するようなものを思い描いていた。 計画は単純だった。私のコンテンツをOpenAIのAPIにアップロードし、AIがそれと対話できるようにすることで、私が共有した豊富な情報に基づいてニュアンスのある答えを提供できる、アクセスしやすいインテリジェントなアシスタントを作るというものだった。

しかし、この旅に乗り出すと、予想以上に複雑な仕事であることがすぐにわかった。 このプロジェクトは、AIの世界にほんの少し足を踏み入れるだけだと思っていたのだが、データの表面的なアップロードだけでは済まない、包括的で複雑な取り組みへと急速に拡大していった。 このプロジェクトは、AI、自然言語処理、ナレッジ・マネジメントの複雑さを深く掘り下げることになった。

私が直面した中心的な課題は、単に情報を保存することではなく、私のオリジナルのコンテンツの深さとニュアンスを反映する方法で、その情報を理解し、文脈化し、正確に検索することをAIに教えることでした。 これは多面的なアプローチが必要で、単純なデータ保存と検索の方法では、ファブリスAIに扱わせたい質問の複雑さには不十分であることがわかったからだ。

ベクトル検索インデックスの使用という初期の試みから、ナレッジグラフ、メタデータ検索、カスタムメイドのAIモデルを含むより高度な手法まで、幅広いアプローチを経て、私は旅に出た。 各アプローチにはそれぞれ長所と短所があり、それぞれがAIの複雑さとデジタル知識管理のニュアンスについて新しいことを教えてくれた。 次回のブログでは、技術的な道のりについて詳しく説明する。

直面した技術的な問題だけでなく、網羅的な知識ベースを生成することも困難であることが判明した。 AIの精度をテストする初期段階において、いくつかの質問に対する最も詳細で正確な回答は、私がビデオインタビューやポッドキャストで答えたものであることがわかった。 正確であるためには、私の投稿、インタビュービデオ、ポッドキャスト、パワーポイントプレゼンテーション、画像、PDF文書をすべて含む知識ベースが必要だった。

私はまず、すべての内容を書き起こすことから始めた。 そもそも自動書き起こしはおおよそのものなので、AIが内容を理解しているかどうかを確認する必要があった。 テープ起こしされた各コンテンツの答えをテストしなければならなかったので、これには長い時間がかかった。

トランスクリプトが私ともう一人の話者を区別しているにもかかわらず、AIは最初に100%の発話内容を私のものだと思い込んでしまった。 私はまた、FabriceのAIに最近のコンテンツをより重視させたかった。 もちろん、それを最初に試したときは、私が最初に記事を投稿した日付ではなく、私がLLMにコンテンツをアップロードした日付を使っていたので、さらに調整が必要でした。

また、網羅性を高めるために、ブログで共有したスライドのナレッジをAzureのOCRモデルを使って画像からテキストに変換し、そのファイルをGPTアシスタントのナレッジベースにアップロードした。 同様に、WordpressのメディアライブラリからPDFをダウンロードし、ナレッジベースにアップロードしました。

ベータテスト中、多くの友人がブログではカバーしきれない個人的な質問をしていることに気づいた。 今後数週間、どのような質問が寄せられるか見守っていきたい。 私のブログの既存のコンテンツで見つけることができない場合に備えて、答えを完成させるつもりだ。 ファブリスAIの回答はブログのコンテンツに限定していますので、ファブリスAIとチャットGPTの混合ではなく、本当にファブリスAIを手に入れることができます。

ここにたどり着くまで、私は長い道のりを歩んできた。 GPT3を使って始めたが、その結果には失望した。 いくつかのブログ記事には質問の意図通りの答えがあったにもかかわらず、間違ったソースを使い続けていたのだ。 何十時間もかけて、正しいコンテンツを使うようにしたにもかかわらず(これは次のブログ記事で取り上げる)、満足のいく結果は得られなかった。

GPT3.5で改善されたものの、まだ期待外れだった。 その後、GPT Builderを使ってGPTストア内にGPTアプリケーションを構築した。 それは少し良く機能し、運用コストも安かった。 しかし、私のウェブサイトでは動作させることができず、また、チャットGPTの有料購読者のみが利用可能で、制限が多すぎると感じました。 いずれにせよ、私は回答の質が気に入らず、一般に公開することに抵抗がありました。

画期的だったのは、モデル4oを使ったGPTアシスタントのリリースだった。 どのコンテンツを使うか私が指示しなくても、GPTが勝手に判断してくれて、すべてがうまくいくようになった。 私はGPTアプリケーションのアプローチを捨て、ブログに埋め込むことができるAPIの使用に戻った。 網羅性を高めるため、Geminiもテストしたが、GPT4oの答えの方が良かった。

今のところテキストのみのバージョンをリリースします。 音声で質問できるように、音声テキスト化機能を搭載しています。 私のような見た目で、会話もできるインタラクティブ・バージョンを開発するために、いくつかの方法を考えています。 プロトタイプはできているのですが、結果と潜在的なコストに満足していません。 一人称で話し、本当に私のように見え、聞こえることを確認したいのです。

今後数カ月でどれだけ進歩するかは見てみないとわからないが、GPT5を待つことに意味があるかもしれない。 今にして思えば、GPT4oを待ってファブリスAIを開発していれば、何百時間もの作業を省けただろう。 それから、調査もポイントのひとつだったし、超面白かった。

とりあえず、ファブリスAIでプレーして、感想を聞かせてください!