
ねえ、最近オープンソースAIの話題が盛り上がってるけど、具体的に何が問題なの?

実はね、AIの世界ではオープンソースの定義がまだはっきりしていないの。ソフトウェアとは違って、AIにはニューラルネットワークの重みがあるから、複雑なのよ。

それで、メタのLlamaみたいな大規模言語モデルはどうなの?

Llamaはオープンソースとされているけど、実際には使用に制限があるから、真のオープンソースとは言えないのよね。

なるほど、それじゃあ本当のオープンソースとは言えないんだね。

OSIはオープンソースの基準を設定してきた組織で、今、AIにもそれを適用しようとしているの。でも、データセットの公開が必須ではない点が議論されているわ。

なるほどね。オープンソースAIの定義が確立されたら、AI業界にどんな影響があると思う?

透明性が増すことで、研究者や開発者がより自由にAIを学び、改善できるようになるわ。それに、イノベーションの加速も期待できるわね。
オープンソースとプロプライエタリの戦い
長年にわたりソフトウェア業界を支配してきたオープンソースとプロプライエタリ(※「独占的な」という意味。 ソースコード、仕様、規格、構造などが公開されていない状態を指す。)の対立が、AIの領域にも波及しています。しかし、AIにおける「オープンソース」の定義は未だ曖昧で、議論が続いています。
メタのAI戦略とその課題
最近のニューヨーク・タイムズの記事では、メタCEOのマーク・ザッカーバーグが「オープンソースAI」を支持していることが評価されていますが、多くの専門家はメタのLlamaブランドの大規模言語モデル(LLM)が真のオープンソースとは言えないと指摘しています。
オープンソースイニシアティブ(OSI)の役割
OSIは25年以上にわたりオープンソースの定義(OSD)を管理しており、ソフトウェアに適用できるライセンスを定義しています。しかし、これをAIに適用するのは難しいとされています。例えば、OSS Capitalの創設者ジョセフ・ジャックスは「オープンソースAIは存在しない」と断言しており、AIのニューラルネットワークの重み(NNWs)はソフトウェアのソースコードとは異なると述べています。
データの透明性とAIのオープン性
現在のOpen Source AI Definitionの草案では、AIシステムはどのように動作するかを学び、研究できる自由を提供することが求められています。しかし、トレーニングデータセットの公開が必須ではない点が議論の的です。データの出所や処理方法の透明性が重要視されており、OSIはこれをオープンソースAIの一部として定義しようとしています。
メタの影響と資金の多様化
メタはOSIの主要スポンサーの一つですが、そのAIモデルLlamaには使用制限があり、本当にオープンソースと呼べるかどうかは疑問視されています。OSIは資金源の多様化を図っており、最近ではスローン財団からの助成金を獲得しました。
オープンソースAI定義の最終段階
現在、Open Source AI Definitionの草案はバージョン0.0.8に達しており、10月のAll Things Open会議で最終承認される予定です。OSIは今後数ヶ月にわたり、世界各地での意見収集を行い、最終的な定義を完成させる計画です。
オープンソースAIの定義は、ソフトウェアのオープンソース定義と同じく、技術の進展に伴い進化していくでしょう。新しい定義がAI業界にどのような影響を与えるのか、今後の動向に注目が集まります。
コメント