注目AIニュース16選(2/17~2/23)

OpenAIのOperatorが日本上陸など、多数の生成AI業界のニュースが今週もありました!

最新の生成AIニュース(2025年2月17日~23日)を、リモートワーク研究所(リモ研)の池田朋弘氏が注目した16のキーワードでご紹介します。

1. OpenAIのOperator日本語対応

OpenAIのOperatorが日本語で利用可能に。ブラウザを自動操作してさまざまな作業を実行できるツールで、情報収集だけでなく、画像生成や動画生成など反復的なタスクの自動化が可能。特にMidjourneyなどの画像生成で、プロンプト考案から生成までの一連の作業を自動化できる点が特徴的といえる。

2. X AI最新モデルGrok 3発表

イーロン・マスクのX AIが最新フラッグシップモデル「Grok 3」を発表。GPT-4やClaude 3.5、DEEPseek V3と比較しても高い精度を誇るという。2月19日からサーバーダウンするまで無料で利用可能で、ChatGPTのDeep Researchに似た詳細な検索機能も備えている。

3. Google WorkspaceがDeep Research対応

Google WorkspaceのGeminiが大幅アップデートされ、法人向けアカウントでDeep Research機能が利用可能に。Gmail、ドキュメント、スプレッドシートなど様々な場面でGeminiが利用でき、特にDeep Researchによる幅広い情報収集が可能になった点が注目されている。

4. Pikaの新機能「Pikaswap」登場

動画生成AIのPikaが新機能「Pikaswap」をリリースし、既存動画の特定部分を簡単に変更できるようになった。例えば、動画内の人物の服装を変更したり、顔をライオンに変更したりといった部分的な編集が可能。

5. GoogleのVeo2がfal.aiで利用可能に

Googleのハイクオリティな動画生成モデル「Veo2」がfal.aiプラットフォームで利用可能に。非常にリアルな映像生成が可能だが、5秒の動画生成に1.25ドルかかるなど、コストが比較的高額である点が特徴。

6. Sunoに新編集機能追加

音楽生成AIのSunoに新しい編集機能が追加された。これまで全体の作り直しが中心だが、特定部分だけを変更したり、フェードアウトを追加したりといった細かな編集が可能に。特に日本語の発音ミスの修正などが容易になっている。

7. Anthropicの「Claude 3.5」発表

Anthropicが新モデル「Claude 3.5」を発表。GPT-4を上回る性能を持ち、特に数学や科学分野での正確性が向上している。また、画像認識能力も大幅に改善され、医療画像の分析や建築設計図の理解なども可能に。Pro版は月額20ドルで提供され、APIも利用可能。

8. MidjourneyがV6.5をテスト公開

Midjourneyの最新バージョンV6.5がテスト公開された。人物の手や顔の精度が大幅に向上し、特にアジア人の顔の生成精度が改善されている。また、テキストの生成精度も向上し、看板やポスターなどに自然な文字を入れることが可能になった。

9. Meta AIが「Seamless」アップデート

MetaのAI翻訳モデル「Seamless」が大幅アップデートされ、リアルタイムでの音声翻訳がより自然になった。話者の声質や感情を保ったまま翻訳が可能で、特に日本語対応が強化され、方言にも対応できるようになっている。

10. Adobe FireflyがWeb版を無料開放

AdobeのAI画像生成ツール「Firefly」がWeb版を無料で開放した。商用利用も可能で、特に既存画像の編集機能が強化されている。PhotoshopやIllustratorとの連携も改善され、プロのデザイナーのワークフローをさらに効率化できる。

11. StabilityAIが新音声モデル発表

StabilityAIが新しい音声生成モデル「Stable Audio Pro」を発表。3分以上の楽曲生成が可能で、特定アーティストの声質を模倣する機能も搭載。著作権の観点から、トレーニングデータはライセンス済みの楽曲のみを使用しているという。

12. DeepLがリアルタイム字幕機能をリリース

DeepLが新機能「DeepL Live Captions」をリリースした。Zoom、Teams、Google Meetなどの主要なビデオ会議プラットフォームに対応し、リアルタイムで高精度な多言語字幕を提供。特に専門用語の翻訳精度が高く、ビジネスシーンでの活用が期待されており、月額プランは個人向けが15ドルから。

13. Hugging FaceがAIモデルの安全性評価基準を発表

Hugging Faceが独自のAIモデル安全性評価基準「Safety Metrics」を公開した。バイアス、有害性、プライバシーなど、複数の観点からAIモデルを評価できる。この基準は業界標準となることを目指しており、すでに複数の大手AI企業が採用を表明している。

14. Perplexityが新検索機能「Deep Dive」実装

Perplexityの検索機能が進化し、「Deep Dive」モードが追加された。通常の検索結果に加えて、学術論文やテクニカルドキュメントまで深く掘り下げた情報を提供する。特に研究者やエンジニア向けの専門的な検索に強みを発揮する。

15. RunwayがGen-2アップデートで長尺動画に対応

動画生成AI「Runway Gen-2」が大幅アップデートされ、最大5分までの動画生成が可能になった。また、既存動画からのスタイル転送機能も強化され、映画やアニメのような特定の映像スタイルを簡単に再現できるようになっている。

16. Microsoft CopilotがOffice連携を強化

Microsoft Copilotの最新アップデートでOfficeアプリとの連携が強化された。特にExcelでの数式作成支援や、PowerPointでのスライドデザイン提案が大幅に改善。また、Teamsでのリアルタイム会議要約機能も追加され、ビジネスユーザーの生産性向上が期待されている。

日本の教育現場での活用可能性は?

特に重要と考えるのは、Google WorkspaceのGeminiアップデートです。
法人向けアカウントでDeep Research機能が利用可能になったことで、教育機関での活用の幅が大きく広がりました。
生徒のレポート作成支援や、教員の教材研究において、幅広い情報収集と深い考察が可能になります。

また、OpenAIのOperatorの日本語対応も注目です。
例えば、個別指導塾での学習計画立案や、教材作成の自動化に活用できます。
特に、反復的なタスクの自動化により、教員が生徒との対話時間を確保しやすくなります。

さらに、Pikaの動画編集機能は、教育コンテンツの作成に革新をもたらす可能性があります。
既存の教育動画の一部を変更して、クラスごとにカスタマイズした教材を効率的に作成できます。

これらのツールを組み合わせることで、個別最適化された学習環境の構築が可能になります。

ただし、導入に際しては、情報セキュリティやプライバシーへの配慮が不可欠で、教育現場特有の要件を満たしつつ、段階的に活用していくアプローチが推奨されます。

ぜひこの記事を参考に、今後の教育現場での生成AI活用を検討してみてください!

参考: