OpenAIから、2024年9月13日に、新モデルであるChatGPT o1 (OpenAI o1)が発表されました!開発コード「strawberry」として開発されていたもので、特に推論能力に優れており、複雑な問題に対して深く考えられる点が最大の特徴となっています。本記事では、このo1シリーズの特徴や使い方、現時点での制限やGPT-4oとの違い、さらに実際に使ってみた感想を記していきます。
なお、ChatGPT 4oのときのレビューについては、下記記事にまとめています。こちらも参考までにどうぞ。
ChatGPT o1の概要
ChatGPT o1シリーズには、o1-previewとo1-miniの2つのモデルがあります。それぞれのモデルは用途に応じて最適化されているようです。ちなみに、読み方は「オーワン」となるようで、また正式名称はChatGPT o1というよりは、OpenAI o1のようです(本記事では分かりやすさを取って、ChatGPT o1としています)。
- o1-preview: より複雑な問題に対応できる高性能モデル。特に、物理学や化学、生物学、プログラミングの分野で高パフォーマンス。
- o1-mini: o1-previewと同じく高い推論力を持ちながら、コストを80%削減したモデル。軽量で効率的。
両者の関係性は、現在のGPT-4oとGPT-4o miniの関係性に類似していますね。ちなみに公式HPでの紹介は下記でなされています。
https://openai.com/index/introducing-openai-o1-preview
ChatGPT o1の特徴
続いて、ChatGPT o1の主な特徴を見ていきましょう。以下の4つが主な特徴となります。
- 高度な推論能力:
- 複雑な問題に対して、より多くの時間をかけて深く考えることができます。特に、数学やコーディングのような問題では、ステップごとの推論が行われ、正確な回答が得られます。
- STEM分野での高パフォーマンス:
- 物理学、化学、生物学などの高度なベンチマークタスクで博士課程レベルの成績を達成しており、数学の国際オリンピック予選で83%の正答率まで向上しています。GPT-4oの13%に比べて大きく進歩したポイントです。
- 安全性の向上:
- 不正なコードの生成や有害な情報の生成を防ぐための強力な安全プロトコルが実装されています。
- コスト効率の良さ:
- 特にo1-miniは、同じ推論力を維持しつつ、コストを大幅に削減しています。これにより、より多くのこと手軽に高度なAIを活用できるようになりました。
これらの中でも、最も売りになっているポイントは「高度な推論能力」です。これによって、今までのChatGPT 4oよりも更に複雑な問題に対して、正確に対処できるようになっています。
ChatGPT o1の使い方:スマホアプリ版
ChatGPT o1は、ChatGPT Plus、Team、Enterpriseのユーザーが利用できます。現時点では、無料のユーザーには解放されていません。
いつも通りですが、発表と同時に実際に使用可能となっていて、ウェブ版でもスマホアプリ版でも使用可能なことを確認しています。
使い方は、ChatGPTを使い慣れている人にとっては、とても簡単です。以下具体的に説明していきます。
まず、PlusまたはTeamアカウントでログインします。ウェブ版でも、アプリ版でもOKです。
新しい会話を開始し、モデル選択メニューから「o1-preview」または「o1-mini」を選択します。
以下、アプリ版の画面を例にとっていますが、左上の「ChatGPT 4o」をタップすることで、下記のようなモデルのリストが出てきます。
通常のChatGPTと同様に、画面下部のチャット欄に質問や指示を入力して会話を進めます。
現時点での制限
ただし、ChatGPT o1には現時点ではいくつかの制限事項があります。上述したように、無料ではまだ使用不可能という部分も制約の一つですね。その他の制限されている部分については、下記の通りとなっています。
1. メッセージ数の制限
o1-previewでは、週30メッセージまで使用可能で、o1-miniでは、週50メッセージまで使用可能となっており、使用回数の制約があります。いずれ引き上げられる可能性はありますが、まだプレビュー版ということでこのような制約が掛かっているものと思われます。
*9/17追記 各モデルの使用回数の制限が引き上げられ、o1-previewでは週50メッセージに、o1-miniでは1日50メッセージに増えています。
なお、上限に当たると下記のようなメッセージが出てきて、「しばらく使えないよ」と使用制限が掛けられてしまいます。
2. ファイル・画像アップロードへの未対応
現時点では、Web検索やファイル・画像のアップロード機能には対応していません。この点はGPT-4oに比べて劣っていて、使用する上では不便な部分ですね。また、DALL-E3を用いた画像生成もできません。
3. 応答に時間がかかる
ChatGPT o1シリーズは、「Chain of Thought」手法を使用して、応答に時間がかかることがあります。複雑な問題を扱うため、順を追って、慎重に推論しているために時間が掛かるようですね。
実際に試してみた感じだと、内容にもよりますが、30秒以上考えている場合もあります。
4. 一般知識分野での制限
ChatGPT o1はいわゆるSTEM分野に強みを持っていますが、その反面、歴史や地理などの一般的な知識に関しては、GPT-4oの方が優れている場合があるようです。
またOpenAIのHPから引用しますが、一般的なライティング(執筆)についてはGPT-4oに対して優位性がないか、やや劣っているように見えます。
ChatGPT-4oとの違い
それでは、ChatGPT o1と現在の主モデルであるGPT-4oの違いはどこにあるのかも説明していきます。
主要な違いは以下の点にあります。
- 推論力の違い: ChatGPT o1は、特に数学やプログラミングのような複雑な問題に対して深い推論を行い、正確な結果を提供します。GPT-4oは多目的に優れていますが、推論の深さにおいてはo1シリーズが上回ります。
- コストとパフォーマンス: 特にo1-miniはGPT-4oに比べてコストが80%も削減されているため、コストパフォーマンスを重視する場合は向いています。
- 安全性の向上: GPT-4oと比べて安全プロトコルが強化されており、不正利用や有害情報の生成を防ぐための対策が徹底されています。
o1-previewを実際に使ってみた感想
それでは、実際にChatGPT o1を使ってみた実例と感想を紹介していきます。
下記では、新モデルである「o1-preview」を用いた例を示しています。具体例としては、推論・数学の問題という比較的得意と予測されるものと、ビジネス戦略の立案という実用的な価値がありそうなものについて、それぞれお題として出しています。
具体的には、①「宇宙に存在する星の数のフェルミ推定」、②「数学オリンピックの問題」、③「5年後に想定される5G対応端末の普及率と市場規模の推定」となっています。
①「宇宙に存在する星の数のフェルミ推定」
明確な答えのない問題でも推論可能なのかを確認するため、「宇宙に存在する星の数」の推定をお題として出してみました。o1-previewからの回答は下記の通りです。
こちらは調べてみると10の23乗個と言われているらしいので、概ね推算としては妥当なところだと思われます。
②「数学オリンピック」の問題
ここでは、マスターデーモンと呼ばれる問題を試しに出しています。具体的な問題としては「2以上の整数nに対し、 (1+2ⁿ)/n²=(1+2^n)/n^2 が整数となるものを全て求めよ」としています。
以下、ChatGPT o1の回答です。
こちらもn=3ということで正しく回答されています。解き方についても、代入してある程度当たりを付けてから、場合分けして解を求めていくのは、割と人間味を感じる推論の仕方ですよね。
③「5年後に想定される5G対応端末の普及率と市場規模の推定」
最後にビジネス的な観点から、市場規模の推定を行ってもらいました。これはコンサルタント代わりに使えるかという観点ですね。
お題は「日本国内の5G通信インフラが整備されることで、5年後に想定される5G対応端末の普及率と、その市場規模はどれくらいか?」になります。o1-previewの回答は以下の通りです。
このように、普及率と市場規模を推算してくれます。概ね妥当そうな推算結果ではありますが、これだけだと物足りないので、追加で「5G関連の電子部材の中で、レッドオーシャン化しにくいと考えられるのは何ですか?その根拠と、何が参入障壁となりうるか考察してください。」と確認していくと、得られるのが下記となります。
このように、レッドオーシャン化しにくい分野を教えてくれるとともに、戦略的な提言も入れてくれます。
こういうコンサル的な役割を担ってくれるのは使えそうだと思いますが、一方で、この分野に専門性がないと正しいのか判断しかねるという使い手側の問題も出てくるように感じます。そういう意味で専門性の高いコンサルの役割を代替するまではいかないのではないでしょうか。
以上のように複数の事例について具体的に確認してみましたが、いずれも正しいと思われる回答がなされているので、推論力は確かに高い印象を受けました。ただ、応答に少し時間がかかることがあり、特に急いでいるときには待つのがちょっとストレスになるかもしれません。
今後の展開について
公式HPを見る限りは、今後のアップデートも計画化されているようです。主要な部分について、下記の通りまとめてみました。
- 無料プランのユーザーでも、o1-miniについてはアクセス可能になる見込みとのこと。
- モデルのアップデートに加えて、ブラウジング機能やファイルや画像のアップロード機能の追加を予定。
- 今回のo1シリーズ以外に、GPTシリーズの開発も進めており、リリースする予定。
まだまだ改良は進められているようですね。最後のGPTシリーズに関する記載は気になるところで、これが今までの続きでナンバリングされるGPT-5のことを指しているのかもしれません。
まとめ
本記事では、ChatGPT o1について、使い方や概要、これまでのモデルとの違いについて解説してきました。改めて要点をまとめたのが下記です。
- ChatGPT o1 (OpenAI o1)は高度な推論能力を持ち、特にSTEM分野でのパフォーマンスに優れる。
- o1-previewとo1-miniの2バージョンがあり、それぞれ異なる特徴と制限がある。
- 高度な問題解決において、ChatGPT o1は非常に有用だが、使用回数制限や応答の遅さなどの制約がある。
- 一般的な用途には、GPT-4oの方が応答速度や汎用性の点で優れている。
- 各モデルの特徴を理解して使い分けることが重要。
本モデルは推論力が高く、特にSTEM分野で非常に高いパフォーマンスを発揮することが期待できます。難解な問題・コーディングなどが必要な場面では、活躍の機会があるものと感じました。ただここまでの推論力が求められるような場面は限られていて、能力を持て余すようにも思いますので、普段使いとしては、これまで通りGPT4oを使用するのが良いのではないかなと思います。
コメント