ナンバーワンソリューションズの堂本です。今回は世界で最も使われているLLMについて解説していきます。
生成AIの進化は目覚ましいものがあり、多くの生成AIツールが誕生していますね。
その中でも、chatgptでも使われている「GPT-4」は、殆どの方が知っているツールの一つです。
個人や企業を含めて、一番使われていると思いきや、世界で最も使われている生成AIは別物ということが判明しました。
しかも、GPT-4は世界で15番目に使われているという現状まで明らかになりました。
一体どのような生成AIが世界で使われているのか、GPT-4と何が違うのかを解説していきます。
1.GPT-4の利用は世界で13位
OpenRoutuer※は2023年からLLMのトークン処理の集計をしています。
このデータによると、今年使われているLLMは以下のようになりました。
順位 | モデル | トークン数 |
1 | MythoMax 13B | 61.4B tokens |
2 | Mixtral 8x7B Instruct | 26.3B tokens |
3 | Toppy M 7B | 11.6B tokens |
4 | Mistral 7B Instruct | 9.7B tokens |
5 | ReMM SLERP 13B | 7.6B tokens |
6 | OpenAI: GPT-3.5 Turbo | 6.8B tokens |
7 | Google: Gemini Pro 1.0 | 6.6B tokens |
8 | OpenChat 3.5 | 6.2B tokens |
9 | lzlv 70B | 5.9B tokens |
10 | MythoMax 13B (extended) | 5.7B tokens |
今年は、上記の表のようになり、OpenAIが開発しているGPT-3.5が6位、そしてGPT-4は12位という結果になっています。
その中でも、注目すべきは、2位と4位に使われているLLMです。
これは、どちらも同じ企業が開発をしている生成AIで、短期間で見ると、1位、2位を占めるほど多く利用されています。
これほど多く使われているMistral、MixtralとはどのようなLLMなのでしょうか?
詳しく見ていきます。
2.世界で一番使われている生成AI(LLM)はMistralとは?
Mistral 7BやMixtral 8×7Bを開発している企業は、フランスのAIスタートアップ「Mistral AI」です。以下のメンバーによって、2023年4月に設立された会社です。
Metaの従業員だったTimothee Lacroix氏、Guillaume Lample氏、
Googleの親会社であるAlphabet傘下のAI企業DeepMindの研究者だったArthur Mensch氏
Mistral AIには複数のLLMのモデルがあります
商用モデルとオープンモデルがある
Mistral AIは複数のAIモデルを開発していて、商用モデルとオープンソースの両方を持っています。
世界で最も使われているLLMのMistral 7BやMixtral 8×7Bは、オープンソースのLLMです。
同社の中でも最も能力が高いのが、Mixtral 8×7B。32Kトークンのコンテキストウィンドウを持ち、英語、フランス語、イタリア語、ドイツ語、スペイン語、コーディングを得意としています。
商用モデルには、「Mistral Small」「Mistral Embed」「Mistral Large」の3つあります。
Mistral SmallとMistral Largeは英語、フランス語、イタリア語、ドイツ語、スペイン語、コーディングを得意としており、32Kトークンのコンテキストウィンドウを持っている。Mistral Embedは今のところ英語版のみで、テキストから抽出された内容の特徴量を抽出するよう設計されています。
Mistral LargeはGPT-4に匹敵する
Mistral Largeは高性能のテキスト生成モデルであり、高いレベルの推論能力を備えており、テキスト理解、変換、コード生成を含む複雑な多言語推論タスクに使用できるという。
同社の発表では、Mistral Largeは標準的なベンチマークで高い結果を達成している。APIを通じて一般に利用可能なモデルとしては、GPT-4に次いで世界第2位と主張している。
マイクロソフトやスノーフレークがパートナーシップ契約
GPT-4に匹敵すると言われるLLMを開発しているMistral AIといち早くパートナーシップを契約したのは、マイクロソフトとスノーフレークです。
生成AIの大手企業との契約により、Mistral AIのLLMが広く使われるようになってきています。
3.Mistralはどのような用途に使われる?
Mistral AIのLLMは実際にどのように使われているのでしょうか?
代表的な内容としては、以下になります。
コード生成
ミストラルAIのLLMは、様々なプログラミング言語のコード生成を支援し、コード生成プロセスを合理化することで、ソフトウェア開発者や専門家に大きな利益をもたらしています。
コンテンツ生成
これらのモデルは、詩、脚本、音楽、電子メール、手紙など、多様な創造的コンテンツを生成することができます。そのため、作家、アーティスト、コンテンツ制作者にとって貴重なツールとなっている。
カスタマーサービス
ミストラルAIのLLMは、チャットボットの作成やカスタマーサポートを通じてカスタマーサービスを強化し、顧客体験全体を向上させるために採用されている。
農業
ミストラルのAI技術は、持続可能な有機農業のプロトタイプ開発に利用されている。これには、AI、RAG、自然農法チャットアプリケーションのためのドメインエキスパートデータセットの活用が含まれる。
教育
Mistral 7Bを活用した高度なチャットボットは、ソクラテスメソッドによる学習を強化し、教育現場におけるLLMの可能性を示している。
twitterでもGPT-4よりもよいという声が上がっています。
4.MistralはGPT-4を超えたか?
Mistral AIのLLMはGPT-4よりも以下の点で優れているという評価があります。
コスト効率
Mistral Largeは価格競争力があり、入力トークン100万個あたり8ドル、出力トークン100万個あたり24ドルで、GPT-4 Turboより約20%安い。このため、大量のデータを処理する必要がある場合、より手頃な選択肢となります。
多言語サポート
Mistral Largeは5ヶ国語に対応しています:英語、フランス語、スペイン語、ドイツ語、イタリア語です。この多言語機能は、異なる言語間での言語モデルサポートを必要とするユーザーや組織にとって特に価値があります。
推論能力
Mistral AIは、単語の並びだけでなく、その背後にある推論と理解を重視しています。この意味論への焦点は、モデルが複雑な質問に答え、より首尾一貫した物語を生成できるようにすることを意図しています。
しかし、処理能力はGPT-4のほうが高い傾向にあります。
5.2024年はオープンソースのLLMが主流になる?
2024年には、この種の技術が主流になるという見方が強まっています。この流れは、世界中のVCからも支持されており、コスト削減の大きな波とともに、多種多様な生成AIツールの誕生を後押ししているようです。
オープンソースが中心になると、コストをかなり抑えることができるので、様々な生成AIツールが生まれてきますね。
しかし、現在の商用モデルの性能を超えるのは容易ではありません。それでも、GPT-4や将来登場するであろうGPT-8をしのぐ新たなモデルが現れれば、市場は大きく変貌するでしょう。
6.まとめ
今回は、GPT-4よりも使われているMistral AIのLLMを紹介しました。
まだGPT-4を超えるLLMのオープンソースのモデルは出てきていませんが、時間の問題かもしれません。
今後も生成AIの最新情報に注目していき、最適な選択をできるように情報発信していきます。