WindowsでOllamaを使うための推奨手順

2025-10-272025-11-15

最も推奨される方法：公式Windows版をインストール

2024年後半から、OllamaはWindows向けにネイティブ実行可能な公式ビルドを提供している。
インストーラ形式で導入でき、追加の仮想環境（WSLやDocker）は不要である。
一般ユーザーから開発者まで、すべての用途でこの方法が推奨される。

公式サイトからインストーラをダウンロード
https://ollama.com/download
インストーラを実行
ダウンロードした OllamaSetup.exe を起動し、指示に従ってセットアップする。
動作確認
インストール後、PowerShellまたはWindows Terminalで以下を実行する。 ollama run llama3 初回実行時にモデルが自動ダウンロードされ、以降はローカルで推論が行われる。

項目	内容
対応GPU	NVIDIA GPU（CUDA対応）推奨。CPUモードも可
既定の保存先	`C:\Users\<ユーザー名>\.ollama`
自動起動	サービスとして常駐（再起動時も利用可）
環境変数	`OLLAMA_HOST`, `OLLAMA_MODELS`, `OLLAMA_API_KEY`などが設定可能

Linux向けのOllamaバイナリを、WSL2環境（例：Ubuntu）で動作させる方法。
GPUを利用したい場合は、Windows上のCUDAサポートが有効化されたWSL2が必要。
ただし、公式Windows版の登場により、この方法は非推奨になりつつある。

curl -fsSL https://ollama.com/install.sh | sh
ollama run llama3

※ GPUを使う場合は、NVIDIAドライバがWindowsホストにインストールされており、WSL統合が有効である必要がある。

OllamaはDockerイメージも提供しており、環境を隔離して動かしたい場合に有効である。

docker run -d -p 11434:11434 ollama/ollama

Windows環境でGPUを使いたい場合は、Docker Desktop設定で 「Use the WSL 2 based engine」および「GPU support」 を有効にする必要がある。

ollama list

ollama pull mistral

OllamaはローカルHTTPサーバを起動するため、以下のようにcurlでアクセス可能。

curl http://localhost:11434/api/generate -d "{ \"model\": \"llama3\", \"prompt\": \"Hello\" }"

WindowsでOllamaを使う場合、公式Windows版インストーラから導入するのが最も推奨される。
これにより、GPU利用・サービス常駐・API連携などが容易に実現でき、WSLやDockerを併用する必要がない。

参考：