注目AIニュース18選(3/10~3/16)

この1週間の生成AI関連は、Google系のサービスのアップデートが目立ちましたが、それ以外にも様々なトピックがありました。

最新の生成AIニュース(2025年3月10日~3月16日)を、リモートワーク研究所(リモ研)の池田朋弘氏が注目した18のキーワードでご紹介します。

1. 中国発の汎用AIエージェント「Manus」

Manusは調査や思考レベルが高く、ChatGPTのDeep Researchを超える性能を持つ。透明性が高く、プロセスを確認しながら方向性を変更できる点が特徴である。
コンテクスト制限やログイン・投稿処理の制約はあるものの、Deep Researchに比べて処理量は3〜5倍程度で、より広範なツールを使用できる。1日1タスクという制限はあるが、AIエージェントとして高い価値を提供している。

2. OpenAIが「Agents SDK」を発表

OpenAIがAIエージェント開発を簡易化する「Agents SDK」を発表した。Web検索、ファイル操作、PC操作などの機能を簡単に実装できる。従来のAssistant APIはResponse APIに統合され、より高度な処理が可能になった。管理画面でエージェントの動作過程をトレースできる透明性も特徴。
複数のエージェントを組み合わせることで、長時間の処理を行うAIエージェントの開発ハードルが大幅に下がっている。

3. GoogleがAIモデル「Gemma 3」をリリース

Googleが10億、40億、120億、270億パラメーターの4種類のオープンソースAIモデル「Gemma 3」をリリースした。
270億パラメーターモデルはClaudeやDeepSeekに匹敵する高性能を実現。120億パラメーターモデルは一般的なパソコンで動作し、表形式の出力や画像認識も可能である。10億パラメーターモデルはスマートフォンでも高速に動作し、実用レベルの回答精度を持つ。

4. Gemini 2.0 Flashがネイティブ画像生成機能を提供

Gemini 2.0 Flashに新たにネイティブ画像生成機能が追加された。ChatGPTが別モデル(DALL-E)を呼び出すのと異なり、Gemini自体が画像生成可能になった点が革新的。ストーリーと画像を同時に生成したり、文脈を理解して一貫したキャラクターの画像を作成したりできる。
また、入力画像を元に指示に従った画像変換も可能で、テキストと画像を統合的に処理できる新しい体験を提供している。

5. Googleカレンダーにイベント自動追加の新機能

Gmailに新機能が追加され、メール内の日程情報を自動的にGoogleカレンダーに登録できるようになった。「Add to Calendar」機能により予定登録がスムーズになる。
これはGeminiの機能の一環であり、Google Workspaceのサイドパネルで利用できる。現時点では日本語対応していないが、メール利用時の予定管理が効率化される機能である。

6.「Googleドライブ」Geminiに機能が追加

Googleドライブ上でGeminiに依頼することで、ファイルやフォルダーを生成できる機能が追加された。単一のファイル作成だけでなく、複数のフォルダーセットを一括で作成するなど、より複雑な操作も可能になった。
これもGeminiのサイドパネル機能の拡充の一環であり、ファイル管理の効率化に貢献する。現在は日本語非対応だが、今後の機能拡充が期待される。

7.「アポドリ」開発から学ぶAIエージェント開発

AIエージェント開発においては、UIや自動化よりも不確実性の高い核心機能の開発を優先すべきである。
アポドリの開発事例では、初期段階ではエンジニアが手作業で対応し、徐々に自動化していく方法を採用した。これにより、実際の業務に即した価値ある機能を効率的に開発でき、業務の文脈を理解し、ユーザーにとって本当に価値のある機能から実装することで、開発コストを抑えながら高品質なAIエージェントを構築できる。

8. OpenAIが「創作が得意なAI」開発を発表

OpenAIのサム・アルトマンCEOがXで創作に特化した新しいAIモデルを開発したと発表した。
このモデルはGPT-4.5と比較して処理能力よりもEQ(感情知能)や人間への説明能力、接触の強化能力が高いとされている。文章創作に特化したこのモデルは、特定用途に特化したAIの方向性を示す一例として注目されている。今後、様々な特定分野に特化したAIモデルが増えていくことが予想される。

9. ManusのAIエージェント強化のブラウザ拡張機能

Manusが使用しているブラウザ自動操作ツール「Browser Use」がオープンソースとして公開された。このツールはOpenAIのオペレーターと比較しても精度が高く、ウェブサイトの操作を効率的に行える。Manusでの採用が話題となり、ダウンロード数が5,000件から3万件に急増した。
開発者は比較的容易にこのツールを自分のプロジェクトに組み込むことができ、AIエージェントのウェブブラウジング能力を大幅に強化できる。

10. ゲーマー向けAI「Copilot for Gaming」発表

Microsoftが「Copilot for Gaming」を発表し、ゲームプレイ中にAIがリアルタイムでアドバイスや操作方法を教えてくれる機能を提供する。
この機能により、子どもたちがゲームをしながら自然にAIを活用する習慣が形成され、AIネイティブ世代の育成につながる可能性がある。音声でAIと会話しながらゲームを進行できる点が特徴で、これは仕事におけるAIとの共同作業の入門としても機能する。

11. Amazonが非構造化データを構造化

Amazonが「Bedrock Data Automation」サービスを発表し、画像、動画、音声、PDFなどの非構造化データから構造化データを抽出する機能を提供する。
現在は日本での利用ができないものの、企業内の非構造化データを活用するニーズは高まっており、今後クラウドプラットフォーム各社が同様のサービスを拡充していくと予想される。ローカルでの処理や低コストでの運用など、様々な選択肢が増えていくだろう。

12. PDFからのテキスト抽出ツール「olm OCR」

高精度かつ低コストでPDFからテキストを抽出できるオープンソースツール「olm OCR」がリリースされた。このツールはアリババのQwen 2.2.0 VLモデルを活用し、表形式のデータも含めて高い精度で文書内容を認識できる。
従来のOCR技術よりも優れた認識精度を持ち、プログラムに組み込んで利用することも可能。クラウドに送信せずにローカルで処理できるため、機密性の高い文書処理にも適している。

13. 中国「Manus」AIエージェントが世界的に注目

中国のスタートアップMonicaが2025年3月6日に「Manus」を発表した。このAIエージェントはGAIAベンチマークでChatGPTやGeminiを上回る性能を示している。
人間の介入なしに複雑なタスクを独自に分析、計画、実行できる自律性を持ち、中国のAI革新におけるリーダーシップを示す重要な事例となっている。ただし、限定的なアクセス、サーバーの不安定さ、停止されたXアカウントなどの問題も指摘されており、開発チームも製品がまだ初期段階であることを認めている。

14. アリババが「QwQ-32B」AIモデルを発表

アリババは2025年3月6日に「QwQ-32B」AIモデルを発表した。このモデルはDeepSeekやOpenAIのモデルと競合するレベルの性能を持ち、強化学習における画期的な進歩を特徴としている。
この発表は中国の520億ドルにおよぶAI推進政策を反映しており、市場の信頼感の高まりを示している。中国のAI開発における重要な一歩となっている。

15. OpenAIが高額なプレミアムAIエージェント導入

OpenAIが2,000ドル、10,000ドル、20,000ドルの3つの価格帯でプレミアムAIエージェントを発表した。
これらのエージェントはDeep ResearchとGPT-4.5を統合し、自動化と意思決定を革新する機能を提供する。高度な処理能力と専門的な機能を備えたこれらのエージェントは、企業向けの高付加価値サービスとして位置づけられている。

16. GoogleがAIモードを検索に追加

Googleが検索に「AIモード」を導入し、AIを活用した検索体験を提供するようになった。このモードでは多様でインタラクティブな検索結果が表示され、ユーザーの意思決定を強化する。
従来の検索結果とは異なり、より包括的で文脈に即した情報を提供することが可能になった。Googleの検索量は過去1年間で22%増加しており、AI駆動の検索代替手段の増加にもかかわらず成長を続けている。

17. 量子ネットワーク向け初のOS「QNodeOS」発表

量子インターネットアライアンス(QIA)の研究者たちが、量子ネットワーク向けの初のオペレーティングシステム「QNodeOS」を開発した。
このシステムにより、様々なハードウェアプラットフォーム間でプログラム可能で実行可能な量子アプリケーションの構築が可能になる。QNodeOSはネットワークハードウェアとソフトウェア間の障壁を取り除き、開発者がシステム固有のコードを必要とせずに量子ネットワークアプリケーションを作成できるようにしている。

18. Salesforceがシンガポールに10億ドルを投資

Salesforceが今後5年間でシンガポールに10億ドルを投資する計画を発表した。
この投資はシンガポールのデジタル変革とAIを活用したプラットフォーム「Agentforce」の拡大を支援するものである。クラウドソフトウェア大手のSalesforceは、企業ソリューションにおけるAI採用を加速させながら、人口動態の変化に伴う労働力生産性向上を目指すシンガポールの取り組みを支援する。

教育現場で活用できるAI技術の可能性は?

最新のAI技術は日本の教育現場や塾、学習環境に革新をもたらす可能性を秘め、特に注目すべきは以下の技術でしょう。

まず、「Gemma 3」の小規模モデル(10億パラメーター)はスマートフォンでも高速に動作し、実用レベルの回答精度を持ちます。
これにより生徒が手元のデバイスで学習支援を受けられるようになります。
また、120億パラメーターモデルは一般的なパソコンで動作し、表形式の出力や画像認識も可能なため、教材作成や学習コンテンツの充実化に貢献できるでしょう。

「Gemini 2.0 Flash」のネイティブ画像生成機能は、ストーリーと画像を同時に生成できるため、視覚的な教材作成や創造的な表現活動の幅を広げることができます。
特に文脈を理解して一貫したキャラクターの画像を作成できる点は、教育コンテンツの質を高めます。

Microsoftの「Copilot for Gaming」は、ゲームプレイ中にAIがリアルタイムでアドバイスを提供する機能を持ち、遊びながら学ぶ「エデュテインメント」の可能性を広げます。
これにより子どもたちがゲームを通じて自然にAIを活用する習慣が形成され、AIリテラシーの向上にもつながるでしょう。

「olm OCR」のようなPDF処理ツールは、教材や資料のデジタル化を効率的に行え、個別最適化学習の基盤となるデータ整備に役立ちます。

これらの技術を組み合わせることで、個々の学習者に合わせた教育環境の構築が可能になるでしょう。

ぜひこの記事を参考に、今後の教育現場での生成AI活用を検討してみてください!

参考: