NVIDIA株暴落、世界の半導体関連などのハイテク株が急落...「DeepSeekショック」と呼ばれているDeepSeekとは一体なんですか?超低コストAIは本当にイノベーションなのか?

この記事は、AI動画生成に専念するVidnozが、DeepSeekとは、DeepSeekの使い方(Webでの利用とローカルでの利用両方詳しく紹介)、DeepSeekのリスクなどを調べて、まとめて紹介しています。
- 目次
- DeepSeekとは
- DeepSeekの現状
- DeepSeekの注目理由
- Deepseekのリリース履歴
- Deepseekの特徴
- DeepSeek-V3の使い方
- DeepSeek-R1の使い方
- DeepSeek APIの使い方
- DeepSeek-R1 ローカルでの使い方
- おまけに紹介:PDFファイルとチャットできるツール
- DeepSeekについてよくある質問
- まとめ
DeepSeekとは
簡単に言いますと、DeepSeek(ディープシーク)とは、中国産AIです。
中国のヘッジファンド「High-Flyer」(中文: 幻方)による資金提供を主に受けており、「大規模言語モデル(LLM)」を開発している企業で開発したLLMです。
近年、LLMは急速に進化し、人間のような知能(AGI)に近づいています。無料公開されているAIモデル(例えばLLaMA、Qwen、Mistralなど)も性能を向上させており、有料モデルとの差を縮めつつあります。その中で、DeepSeek-R1の登場は、AI技術の進化における重要な一歩とされています。
DeepSeekの現状
2025年1月28日、記事執筆時点で、「DeepSeek」ショックでハイテク株がパニック売りことで、DeepSeekがアメリカのテクノロジー業界で大きな話題を集めています。
iOS アプリストアのダウンロードランキングでは、DeepSeekアプリが一気に1位に躍り出ました。

DeepSeekの注目理由
去年12月から、DeepSeekが注目を集めていました。その理由は、DeepSeekが非常に高性能でありながら、完全にオープンソース(誰でも自由に使える技術)として公開され、さらに驚くほど低コストで利用できるからです。
なぜDeepSeekがすごいのか?
- 高性能: 最新のモデルは、世界トップクラスのAIと競争できるレベル。
- 無料公開: 多くのモデルを無料で公開し、誰でも自由に使えるようにしている。
- 低コスト: 高品質なAIを比較的低コストで提供。
Deepseekのリリース履歴
DeepSeekは、AI技術の分野で次々と新しいモデルを開発し、世界中から注目を集めている企業です。その進化の過程と、なぜこれほど評価されているのかを簡単に説明します。
1. 最初の一歩:DeepSeek Coder(2023年11月2日)
DeepSeekが初めて発表したモデルは「DeepSeek Coder」でした。このモデルは、研究者や企業が無料で使えるように公開されました。特に、プログラムのコードを書くためのAIとして開発され、AI技術の活用を広める第一歩となりました。
2. さらなる進化:DeepSeek LLM(2023年11月29日)
次に、DeepSeekは「DeepSeek LLM」という新しいモデルをリリースしました。このモデルは、当時の他のAIモデルと競争できるように設計され、特にOpenAIの「GPT-4」に近い性能を目指していました。これにより、DeepSeekはAI技術のトップランナーの仲間入りを果たしました。
3. 最新の飛躍:DeepSeek-V3(2024年12月)
2024年12月には、DeepSeekのモデル「DeepSeek-V3」が登場しました。このモデルは、6710億ものパラメータ(AIの「脳」の複雑さを表す数値)を持ち、約55日間の学習と558万ドルの費用をかけてトレーニングされました。その結果、他の有名なAIモデル(Llama 3.1やQwen 2.5)を上回る性能を達成し、OpenAIの「GPT-4」やAnthropicの「Claude 3.5」と肩を並べるレベルにまで成長しました。
4. オープンソース化:DeepSeek-R1シリーズ(2025年1月20日)
さらに、DeepSeekは「DeepSeek-R1-Zero」と「DeepSeek-R1」という2つの推論モデルを無料で公開しました。これらのモデルは、数学の問題を解く能力が非常に高く、OpenAIの「o1」モデルを上回る性能を示しました。特に、アメリカの数学コンテスト「AIME」や「MATH」といった難しいテストで高いスコアを記録し、その実力を証明しました。
参考資料:https://ja.wikipedia.org/wiki/DeepSeek
AI喋らせるアバターを作成する - 無料
- 違う文化からの1500+リアルなアバター
- 口と動き、ナレーションが同期可能
- 複数のアクセント付きの140+言語サポート
Deepseekの特徴
下記ではDeepSeek-V3とDeepSeek-R1の特徴をそれぞれ説明します。
DeepSeek-V3の技術的な特徴
DeepSeek-V3は、高度な言語モデルで、テキストを中心にさまざまなタスクをサポートします。その高性能と低コストが一番の特徴です。
パラメータ数
DeepSeekが持つパラメータ数は6710億に達しています。
約370億個のパラメーターが活性化されて、14.8兆の高品質トークンを用いて事前学習されています。
ご参考に、Meta Llama 3.1 が持つパラメータ数は4050億で、DeepSeekが持つ6710億のパラメータ数はMeta Llama 3.1の1.6倍です。(データ出典:Impress Watch)
FP8混合精度トレーニングの革新
DeepSeekは、FP8(8ビット浮動小数点)と呼ばれる超効率的な計算技術を採用しています。従来の16ビットや32ビットの演算と比べ、メモリ使用量の削減、ハードウェア(GPU/TPU)の性能を最大限に活用により計算速度の向上、複数機器間のデータ転送効率を改善などのメリットがあります。
これにより、大規模モデル(例:6710億パラメータ)でも、従来の約1/3のリソースでトレーニング可能です。
MoEアーキテクチャの効率性
「Mixture of Experts(専門家の組み合わせ)」が組み込まれることで、タスクごとに必要な部分のみを活性化し、従来モデルと比べ、不要なパラメータ使用を最大50%削減します。

出典:https ://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdf
多ラベル予測目標(MTP)
MTP(Multi-Target Prediction)を導入することで、複数の出力の予測精度を最適化し、推論速度(推測的デコード)も向上させています。
革新的な負荷分散戦略
従来のMoE(Mixture of Experts)モデルは、補助的な損失関数に依存していましたが、DeepSeek-V3は補助損失を使わない新しい負荷分散メカニズムを採用しています。これにより、モデルの性能制限を低減し、効率を向上させています。
その結果、DeepSeekのトレーニングコストはわずかの約558万ドルで、278.8万GPU時間です。そのほかの同じ規模のモデルの1/10しかありません。
参考:「R1」のトレーニングコストはOpenAIの推論モデル「o1」の約3%程度。(出典:Gigazine)

このように、DeepSeekは高性能と低コストを両立しています。
DeepSeek-V3は数学、コーディング、多言語対応、推論生成タスクにおいても優れた性能を発揮しています。
DeepSeekの技術レポートによると、DeepSeek-V3は、Alibabaの「Qwen2.5-72B」やMetaの「Llama-3.1-405B」といった他のオープンソースモデルを上回る性能を示し、さらにOpenAIの「GPT-4」やAnthropicの「Claude-3.5 Sonnet」といった有料の最先端モデルとも競争できるレベルです。

DeepSeek-V3の欠点
マルチメディアタスクの制限
他のツールとは異なり、DeepSeekはオーディオや動画コンテンツの作成には対応していません。 例えば、テキストから動画生成することが現時点ではできません。
AIでテキストを動画に変換しよう - 無料
ただ1ステップだけでPDF、PPT、URLから高画質の動画を作成します。
言語サポートの開発中
多言語をサポートしていますが、一部の高度な機能はすべての言語や表現に最適化されていません。
2025年1月27日、CyberAgentがDeepSeek-R1-Distill-Qwen-14B/32Bをベースに日本語データで追加学習を行ったLLM(大規模う言語モデル)を公開しました。ダウンロードしてローカルで利用できます。
DeepSeekをローカルで利用する方法は下記で紹介しますので、続いて見ていきましょう。
DeepSeek-R1の特徴
DeepSeek-R1の最も大きいなと特徴は、OpenAI o1に匹敵する推論モデルということです。
強化学習を活用
DeepSeek-R1は、AIの学習方法の一つである「強化学習」を大規模に活用しています。これにより、わずかなデータしかなくても、AIの推論能力を大幅に向上させることができました。
数学やプログラミングに強い
このモデルは、数学の問題を解いたり、プログラムのコードを書いたりする能力が非常に高いです。
オープンソースで無料公開
DeepSeek-R1は、MITライセンス(商用利用できることを指す)という条件で無料公開されています。これにより、誰でも自由に使うことができ、研究者や企業がAI技術を活用しやすくなりました。
DeepSeek-V3の使い方
ほかの生成AIモデルと同様に、DeepSeek-V3は質問に回答を生成したり、ウェブ検索をしたりすることができます。
Web版で利用の場合
DeepSeekはWeb版で利用の場合、だれでも無料で使えます。
1. DeepSeek公式サイトへアクセス。
https://www.deepseek.com/
2.「Start Now」をクリックして、登録します。Googleと連携しているため、グーグルアカウントで登録が可能です。

3. ChatGPTのように質問を入力するだけで、DeepSeekが返答してくれます。

4. ネットで情報を検索した回答を求めたい場合は、「Search」(検索)を選択する必要があります。

アプリで利用の場合
DeepSeekアプリで利用の場合も無料で使えます。
1. DeepSeek公式サイトからアプリをダウンロードするQRコードが表示されます。

または、App StoreやGoogle PlayからiOSおよびAndroidアプリをダウンロードします。
2. グーグルアカウントとApple IDで登録できます。

3. ログインするとスマホアプリで、DeepSeekとチャットできます。
DeepSeek-R1の使い方
DeepSeek-R1は、推論モデルを活用して、詳しく説明することができます。こちらも無料で利用できます。
登録や使い手順はDeepSeek-V3とほぼ同じで、「DeepThink(R1)」を選択して、チャットすればOKです。

DeepSeek APIの使い方
APIサービス利用は、有料ですが、同類モデルと比べれば、超安価格で使用できます。
1. 公式サイトの右上から「API Platform」をクリックして、APIサービスに入ります。

2. Googleアカウントで登録します。
3. APIサービスを利用するには、費用がかかります。

deepseek-chatはDeepSeek-V3の料金で、100万のトークンでわずか0.014ドルがかかります。※北京時間2025-02-08 24:00まで、DeepSeek-V3 APIの値引き価格で利用できます。
deepseek-reasonerはDeepSeek-R1の料金です、100万のトークン(約75万語の分析)でわずか0.14ドルがかかります。
DeepSeek APIは、他のAIサービスと比較して非常に低価格で提供されています。詳しくは:https://api-docs.deepseek.com/quick_start/pricing
DeepSeek-R1 ローカルでの使い方
DeepSeek R1のWeb版を利用する場合、入力した内容がアップロードされる恐れがあります。
※入力した内容がDeepSeekに読み取るかに不安なら、インターネットに接続しないまま、ローカル環境での利用をおすすめします。
DeepSeek-R1をローカルで利用する手順を下記にて紹介します。
① llmをローカルで利用するためのソフト「lmstudio」をダウンロードします。
公式サイト:http://lmstudio.ai/

② 「lmstudio」をインストールします。
利用可能なスペースの大きいディスクにインストールすることをおすすめします。

③ インストールした後、「Get your first LLM」をクリックします。

④ 左側の検索アイコンをクリックして、LLMモデルを検索します。

⑤ GGUFファイルをダウンロードする必要があります。
この段階では、「DeepSeek-R1-Distill-Llama-8B-GGUF」や「DeepSeek-R1-Distill-Qwen-14B-GGUF」などの結果があります。
お使いのデバイスのスペック(特にCPUとGPUの容量)に合わせて、選択すればよいです。
右側の「Q*」のところをクリックして、「likely too large for this machine」(このデバイスにとって大きすぎるようです)が表示されたら、それ以下のバージョンを選択します。
著者のパソコンでは、「DeepSeek-R1-Distill-Llama-8B-GGUF」が大きすぎると提示され、「DeepSeek-R1-Distill-Qwen-1.5B-GGUF」をインストールしました。

※日本語で出力したい場合、上記で紹介したCyberAgentがDeepSeek-R1-Distill-Qwen-14B/32Bをベースに日本語データで追加学習を行ったLLM(大規模う言語モデル)をダウンロードして利用してください。

⑥ 右下の「ダウンロード」ボタンをクリックすると、ダウンロードがします。

⑦ ダウンロードが完了後、DeepSeekモデルをロードします。

⑧ ロードが完了したら、ローカル環境でDeepSeek-R1とチャットできます。
おまけに紹介:PDFファイルとチャットできるツール
DeepSeekは一時的にサーバーに攻撃が受け、登録できない状態になってしまいます。
PDFファイルとチャットして、100枚の論文でも、1日で全ての内容を理解できるVidnoz ChatPDFをおすすめします。
Vidnoz ChatPDF - 無料でPDFとチャットする方法
1. Vidnoz ChatPDFの公式サイトで、ナビゲーションからChatPDFをクリックします。
2. PDFファイルをアップロードします。
3. 質問して、チャットの形で、資料の内容を理解できます。
簡単でしょう?VidnozがPDFを読み込み、その内容をAIで分析し、質問に回答します。日本語だけではなく、英語、フランス語など多言語にも対応しております。
そのほかに、Vidnozにはテキストを音声に変換するツールや画像を動画にするツールも提供されています。
DeepSeekについてよくある質問
DeepSeekはリスクがありますか?
著者が実際に利用してみての感じだが、一般人にとって、あまりリスクが感じません。しかも、ChatGPT Plusに課金していないので、無料で「推論モデル」が利用できる点について、DeepSeekの方が便利だと思います。
企業の面から考えますと、DeepSeekのような、オープンソースモデルがさらに発展されると、中小企業がクラウドサービス((AWS、Azureのような)への依頼が減っていく可能性があるかと思います。それに伴い、これらのクラウドサービス業者がGPUへの需要ニーズも減るかもしれません。前日deepseekショック(Nvidia株暴落)の原因は複雑ですが、これもその原因の一つかなと考えます。
DeepSeek AIの実力は?
DeepSeek-V3は、最高性能のAIモデルの一つであり、多くのオープンソースモデルを上回る性能を誇ります。市場をリードするGPT-4やClaude-3.5にも匹敵するレベルです。
DeepSeekは日本語に対応しますか?
はい、DeepSeekに日本語で質問することは可能です。Deepseekも日本語で回答してくれますが、「Search」(検索)機能を利用した場合、参照元が英語webページの場合もあります。
DeepSeekはAPIサービスを提供しますか?
DeepSeekは、強力なAPIを提供しており、その機能をサードパーティのアプリケーションに簡単に統合できます。これにより、さまざまなプロジェクトでの利用が可能です。使い方や料金は上記で紹介しております。ぜひ参考にしてください。
DeepSeekのコスパはどうですか?
はい、DeepSeek-V3は、同等の性能を持つモデルと比べると、はるかに低いコストで提供します。これにより、経済的で効率的な選択肢となっています。
DeepSeekの今後の発展の見通しは?
DeepSeekは、大規模言語モデル(LLM)分野での継続的なイノベーションを目指しており、モデルの正確性、汎用性、効率性の向上に注力しています。
まとめ
この記事では、DeepSeekとは何かを調査し、DeepSeek-V3とDeepSeek-R1の使い方について紹介しました。
世界を揺るがすDeepSeekは人工知能の分野におけるイノベーションをもたらし、世界に大きな贈り物を提供したと思います。
DeepSeek、またはVidnoz AIのようなあるコンテンツ作成に力を入れているAI企業が私たち日々の生活に大きな影響をもたらしました。AI技術が発展することで、長期的にはAIを利用する最大の勝者は消費者と企業でしょう。
Vidnoz AI - 顔写真動かしツールで魅力的なAI動画を作成しよう
- リアルなアバターで専門的なAI動画を簡単に作成する
- 多言語サポートのAI音声読み上げ機能
- 2800+動画テンプレートで様々なシーンに対応
- URL、PDF、PPTなどから動画を作成する