最新の生成AI技術が次々と登場し、その進化はとどまるところを知りません。Googleが開発したテキスト生成を最大4倍高速化する「DiffusionGemma」や、Moonshot AIによる1兆パラメータ規模のコーディング特化AI「Kimi-K2.7-Code」は、開発効率を飛躍的に向上させる可能性を秘めています。また、中国アリババからは既存の衛星画像から地球全体を3Dモデル化する「ABot-Earth 0.5」が発表され、地理情報システムに新たな道を開くかもしれません。本稿では、これらの画期的な生成AI技術5つを詳しく掘り下げて解説します。
Googleがテキスト生成を最大4倍高速化する「DiffusionGemma」を発表
Googleは、テキスト生成の速度を大幅に向上させるAIモデル「DiffusionGemma」をApache 2.0ライセンスの下で公開しました。このモデルは、Gemma 4ファミリーをベースにしており、MoE(Mixture of Experts)アーキテクチャを採用しています。総パラメータ数は260億ですが、推論時にアクティブとなるのは38億パラメータで、量子化することで18GBのVRAMに収まり、ハイエンドの消費者向けGPUでも動作可能です。
DiffusionGemmaの最大の特徴は、従来のLLMがトークンを一つずつ順に生成する自己回帰型とは異なり、画像生成に用いられる拡散技術をテキストに応用している点です。これにより、最大256トークンのテキストブロックを一度に同時生成することが可能になり、専用GPU上での推論速度が最大4倍に向上します。例えば、NVIDIA GeForce RTX 5090では毎秒700トークン以上、H100では毎秒1000トークン以上の生成能力を発揮します。
Moonshot AIの1兆パラメータコーディングAI「Kimi-K2.7-Code」が登場
Moonshot AIは、コーディングに特化したエージェント型AIモデル「Kimi-K2.7-Code」のオープンウェイトを公開しました。このモデルは、既存のKimi K2.6を基盤とし、複雑なソフトウェア開発ワークフローにおける現実的な長期コーディングタスクの遂行能力を強化しています。
「Kimi-K2.7-Code」は、MoE(Mixture-of-Experts)アーキテクチャを採用し、総パラメータ数は1兆、アクティブパラメータ数は320億、コンテキスト長は最大256Kを誇ります。また、トークン効率も改善され、前世代のK2.6と比較して思考プロセスにかかるトークン消費量を約30%削減することに成功しました。さらに、MoonViTによるビジョンエンコーダを搭載しているため、テキストだけでなく画像や動画の入力にも対応します。
ベンチマークテストでは、全体的なスコアでGPT-5.5やClaude Opus 4.8には及ばない項目が多いものの、前世代のK2.6からは大幅な性能向上が見られます。特に一部のエージェントタスク(MCP Mark Verified)ではClaude Opus 4.8を上回り、MLS Bench LiteではGPT-5.5に肉薄するなど、最先端モデルに迫る高いパフォーマンスを示しています。
このモデルは、月間アクティブユーザー数が1億人を超える、または月間売上が2,000万米ドルを超える場合を除き、クレジットなしで商用利用が可能です。
CohereがQwen3.5やGemma 4を凌駕するコーディングAI「North Mini Code」を公開
カナダのAIチームCohereは、コーディング向けAIモデル「North Mini Code」をApache 2.0ライセンスで公開しました。このモデルは、300億パラメータ(アクティブパラメータ30億)のMoEアーキテクチャを採用し、自律型エージェントのソフトウェアエンジニアリングタスク、ターミナル操作、そしてコード生成に特化して設計されています。
Artificial Analysisのコーディング指標では33.4というスコアを記録し、Qwen3.5やGemma 4といった同規模のモデルだけでなく、一部の1000億パラメータを超える大規模モデルをも凌駕する高い性能を示しています。
アリババが既存の衛星画像から地球を3D化する「ABot-Earth 0.5」を発表
Alibaba GroupのAMAP CV Labは、既存の衛星画像から広大な探索可能な3D環境を生成するAIモデル「ABot-Earth 0.5」を発表しました。これまで都市の3D化には、航空機からの写真測量やLiDARによるレーザースキャンが主流で、コストと時間がかかる課題がありました。
しかし、ABot-Earth 0.5は、既存の衛星画像のみを材料として利用し、1平方キロメートルあたり10分未満で新たな3Dシーンを合成できます。技術的には、写実的な表現に適した「3D Gaussian Splatting」(3DGS)をベースにしており、現実の都市データを用いて学習が行われています。これにより、建物の外観や植物などの複雑な構造も自然に再現することが可能です。
さらに、詳細なデータを階層的に扱うLOD(Level of Detail)構造を標準で備えているため、Webベースの地図エンジン上で、地球規模の広い視点からストリートレベルの視点まで、動きを止めることなくスムーズに拡大・縮小して閲覧できます。生成された3D環境は、単なる視覚的な地図としてだけでなく、ドローンの自動航行や障害物回避といったAIの訓練環境としても活用でき、実世界に近い条件を提供します。
最適なローカルLLMを教えてくれるCLIツール「whichllm」
自分のPCでどのローカルLLMが最も快適かつ賢く動作するのかを、コマンド一つで教えてくれるCLIツール「whichllm」の最新版v0.5.10がMITライセンスでリリースされました。このツールは、実測ベンチマークに基づいてローカルLLMをランク付けし、ユーザーの環境に最適なモデルを提示します。
【管理人の視点】日本の開発者と地理情報分野への影響
今回紹介された生成AI技術群は、日本の様々な産業に大きな影響を与える可能性があります。特に、Moonshot AIの「Kimi-K2.7-Code」やCohereの「North Mini Code」といった高性能なコーディングAIは、日本のソフトウェア開発者の生産性向上に直結するでしょう。無料または商用利用可能なモデルが増えることで、中小企業やスタートアップでもAIを活用した開発が加速するはずです。複雑なタスクをAIに任せることで、開発者はより創造的な仕事に集中できるようになるかもしれません。
また、アリババの「ABot-Earth 0.5」は、地理情報システム(GIS)や都市計画、防災、環境モニタリングといった分野に革新をもたらす可能性を秘めています。高精度な3D地球モデルが低コストかつ迅速に生成できるようになれば、バーチャルツインの構築や、災害シミュレーションの精度向上に貢献するでしょう。日本の国土は複雑な地形を持つため、このような技術の活用は特に重要です。
Googleの「DiffusionGemma」による高速テキスト生成は、コンテンツ作成やカスタマーサポートの効率化に寄与し、多言語対応が進めば、日本のグローバルビジネス展開にも有利に働くでしょう。さらに、「whichllm」のようなツールは、ローカル環境でAIモデルを試したい日本の研究者や開発者にとって、最適な選択肢を見つける手助けとなります。これらの技術が日本語にどう対応し、日本市場でどのように展開されるか、今後の動向に注目が集まります。
まとめ
今週の生成AIウィークリーでは、Googleの高速テキスト生成AI「DiffusionGemma」、Moonshot AIの1兆パラメータコーディングAI「Kimi-K2.7-Code」、Cohereの高性能コーディングAI「North Mini Code」、アリババの地球3D生成AI「ABot-Earth 0.5」、そしてローカルLLM最適化ツール「whichllm」という5つの注目すべき技術を紹介しました。これらの技術は、開発効率の向上、地理情報システムの革新、そしてAIモデル活用の最適化といった多岐にわたる分野で、今後の生成AIの進化を牽引していくことでしょう。それぞれの技術が持つ可能性を最大限に引き出し、社会にどのような変革をもたらすのか、引き続きその動向を注視していきます。
情報元:techno-edge.net

