ChatGPTのような西部AIソリューションに代わる大幅に安価な代替品を提供する中国の開発モデルであるDeepseek AIの出現は、ハイテク業界で激しい議論と懸念を引き起こしました。今週、ドナルド・トランプ元大統領は、Nvidiaの市場価値が6,000億ドル減少したことに続いて、Deepseekを米国の技術部門の「ウェイクアップコール」と名付けました。 AIオペレーションに不可欠なGPU生産のリーダーであるNvidiaは、株式が16.86%急落し、ウォール街の歴史において最大の1日の損失をマークしました。 Microsoft、Meta Platforms、Googleの親会社であるAlphabetなどの他のハイテク大手は、2.1%から4.2%の範囲の減少を経験しましたが、AIサーバーメーカーのDell Technologiesは8.7%減少しました。
オープンソースのDeepSeek-V3に基づいて構築されたDeepSeekのR1モデルは、西部のカウンターパートよりもかなり少ないコンピューティングパワーを必要とすると主張し、わずか600万ドルで訓練されたと伝えられています。これらの主張は論争中ですが、Deepseekの導入は、アメリカのハイテク企業がAIに行っている大規模な投資について疑問を投げかけ、投資家の不安を引き起こしました。モデルの人気が急増し、その能力に関する議論が高まっている中で、米国の無料アプリのダウンロードチャートのトップにそれを推進しました。
ブルームバーグは、OpenaiとMicrosoftがDeepseekがOpenaiのAPIを利用してOpenaiのAIモデルを独自の練習に組み込むかどうかを調査していると報告しました。 Openaiはブルームバーグに、「私たちはPRC(中国)に拠点を置く企業、およびその他は、米国の大手AI企業のモデルを絶えず蒸留しようとしていることを知っています」と述べています。より大きく、より有能なものからデータを抽出することによりAIモデルのトレーニングを伴う蒸留は、Openaiの利用規約に違反します。 Openaiは、知的財産を保護するというコミットメントを強調し、米国政府と協力して、敵対的および競争的な脅威から高度なAIモデルを保護することの重要性を強調しました。
トランプの人工知能皇帝であるデイビッド・サックスは、フォックス・ニュースに「ディープシェクがここでやったことは、彼らがOpenaiモデルから知識を蒸留したことであり、Openaiがこれについてあまり満足しているとは思わないという実質的な証拠がある」と語った。彼は、大手AI企業が今後数か月でそのような蒸留を防ぐための措置を講じると予想しています。
Deepseekは、Openaiのモデルを使用して蒸留を使用して競合他社を訓練したと非難されています。画像クレジット:Andrey Rudakov/BloombergはGetty Imagesを介して。
これらの発展の中で、オブザーバーは、著作権で保護された資料を使用してChatGptを訓練するという独自の歴史を考えると、Openaiの状況の皮肉に注目しています。 Tech PRで作家のEd Zitronは、「笑いを止めることができないのはごめんなさい。インターネット全体を盗むことに基づいたOpenaiは、DeepseekがChatGptからの出力を訓練した可能性があるため、泣いています。彼らは目を叫んでいます。
2024年1月、Openaiは、英国のLords Communications and Digital Select委員会への提出で、著作権で保護された資料なしでChatGPTのようなAIモデルをトレーニングすることは「不可能」であると認めました。彼らは、著作権がほぼすべての形態の人間の表現をカバーするため、著作権で保護された材料を除外すると、AIシステムの有効性と関連性が大幅に制限されると主張しました。
著作権で保護された資料に関するAIのトレーニングの問題は、特に生成AIの増加に伴い、ハイテク業界の焦点となっています。 2023年12月、ニューヨークタイムズは、製品を開発するための作業の「違法使用」のためにオープンライとマイクロソフトを訴えました。 Openaiはその慣行を擁護し、そのようなトレーニングは「公正使用」を構成し、ジャーナリズムとニュース組織とのパートナーシップに対する支援を強調しました。
この訴訟は、2023年9月に別の訴訟に続き、ジョージRRマーティンを含む17人の著者が「大規模な体系的な盗難」でオープンを非難した。さらに、2023年8月、ベリル・ハウエル地区裁判官は、著作権保護における人間の創造性の必要性を強調して、AIが生成された芸術を著作権で保護できないと2018年からの米国の著作権局を支持しました。