Hermes Agent 自社サーバー構築完全ガイド|Mac mini/Ubuntu+RTX 3090実装で経営者が試す手順【2026年最新】
週77時間Claude Codeで会社を動かすAI社長が、3号機(Ubuntu+RTX 3090)で運用中のHermes Agentを「自社サーバー構築」の実体験で解説。クラウドではなくオンプレ前提のセットアップ、Ollama連携、systemd常駐、Banリスク回避、Mac mini/Ubuntu/Windows別の最短手順を2026年最新版で公開。
執筆者: 古田 健
株式会社37Design 代表取締役 / 14プロダクト運用中の現役AI顧問
こんにちは、37Design代表の古田です。週77時間Claude Codeを使うAI社長 として、自社で14プロダクトを並走運用しています (直近1週間ピーク値、月300時間到達が次の目標)。
私の37Designでは、3号機 (Ubuntu + RTX 3090 24GB) に Hermes Agent v0.13.0 を PoC 運用しています。Claude Code をメイン本番に置きつつ、Hermes は 副系の実験場兼ローカル推論ボックスとして走らせている構成です。
「Hermes Agent を自社で構築したいけど、クラウドデプロイ系の解説 (Zeabur / Tencent / NocoBase) ばかりで、オンプレ実装の具体的な手順がまとまっていない」「Mac mini か Ubuntu か、ローカルマシンで動かす場合の選び方が分からない」「systemd で常駐させるベストプラクティスは?」——2026年5月時点で経営者・エンジニアからもらう質問の中身です。
この記事では、3号機 + RTX 3090 で Hermes Agent を実運用している立場から、Mac mini / Ubuntu / Windows それぞれの自社サーバー構築手順、Ollama 連携、systemd 常駐化、Banリスク回避を体系的に解説します。クラウドデプロイ前提の既存記事では拾えない「自前ハードで本気で動かす」視点に絞った日本語ガイドです。
Hermes Agent そのものの概要や Nous Research 背景は Hermes Agentとは?Nous ResearchのOSS AIエージェント完全ガイド を、近縁の OSS は OpenClawとは?Claude Code互換OSSエージェント完全ガイド を併読してください。
自社サーバー構築の前提 - なぜクラウドではなくオンプレなのか
結論 - Hermes は「自宅 or 自社サーバーで常駐」が本来の使い方
Zeabur / Tencent Cloud / NocoBase のクラウドデプロイガイドが先行していますが、Hermes Agent の本来の強みは「自分が完全に支配できる環境で動かす」こと にあります。理由は3点です。
- 永続メモリと自動スキル生成はローカル運用が大前提 - Hermes の Tier1-3 memory は時間をかけて育つ資産。クラウドベンダー依存になると移行コストが跳ねる
- Ollama 連携でローカル LLM を併用できるのが旨味 - 機密度の高いタスクは GPU 搭載マシンで完結させたい
- Claude Code との分離運用には自社制御が必須 - メイン本番 (Claude Code) と副系 (Hermes) を物理サーバー単位で分けたい
必要なスペック - 用途別の現実的ライン
| 用途 | 推奨スペック | コメント |
|---|---|---|
| お試し PoC (CPU推論のみ) | Mac mini M2 / 16GB RAM | 軽量タスク・スキル試作までは十分 |
| 軽量本番運用 (8B以下のLLM) | Mac mini M4 Pro / 32GB RAM | Ollama 8B級なら実用速度 |
| 本気のローカルLLM運用 (13-30B) | Ubuntu + RTX 3090 24GB | 古田スタックの3号機構成 |
| 大規模ローカル運用 (70B+) | デュアル RTX 3090 / RTX 4090 | 月数十万円コース、ROI注意 |
私の3号機 (ASRock B450 + RTX 3090) は中古パーツで20万円前後で組めました。Mac mini M4 (整備済品) も同価格帯。「自社サーバー構築」のハードル金額は20-30万円と現実的なラインに収まります。
Hermes Agent の構築手順 - Ubuntu Server 編 (最推奨)
Step1 - 動作環境の準備
私の3号機 (Ubuntu 22.04 LTS) では次の構成で動かしています。
# Node.js v22 LTS (Hermes は v22+ を要求)
curl -fsSL https://deb.nodesource.com/setup_22.x | sudo -E bash -
sudo apt-get install -y nodejs
# CUDA (RTX 3090 用 / Ollama GPU推論)
sudo apt install nvidia-driver-535 nvidia-cuda-toolkit
# Docker (オプション、コンテナ化したい場合)
sudo apt install docker.io docker-compose
sudo usermod -aG docker $USER
GPU 不要の構成 (Mac mini 等) なら CUDA セクションは飛ばし、Ollama だけ後段で入れます。
Step2 - Hermes Agent 本体のインストール
# 公式ワンライナー (推奨ルート)
curl -fsSL https://hermes-agent.org/install.sh | bash
# または npm 経由
npm install -g @nousresearch/hermes-agent
# バージョン確認
hermes --version
# Hermes Agent v0.13.0
hermes setup を実行すると、対話形式でモデル選択と API キー登録ができます。
Step3 - LLM プロバイダー設定
私の3号機では 2系統併用 で組んでいます。
- メイン: Anthropic Claude API (Sonnet 4.6 / Opus 4.7) - 高精度が必要なタスク
- サブ: Ollama (qwen2.5-coder:14b) - 機密度が高い or 大量バッチ処理
# Ollama のインストール
curl -fsSL https://ollama.com/install.sh | sh
# モデルの取得 (14Bは RTX 3090で快適)
ollama pull qwen2.5-coder:14b
ollama pull llama3.1:8b
Step4 - 設定ファイルの基本構造
~/.hermes/config.json に必要最低限の設定を書き込みます。
{
"providers": {
"anthropic": {
"api_key": "sk-ant-...",
"default_model": "claude-sonnet-4-6"
},
"ollama": {
"host": "http://localhost:11434",
"default_model": "qwen2.5-coder:14b"
}
},
"memory": {
"tier1_short": 50,
"tier2_mid": 500,
"tier3_long": "unlimited"
},
"skills_dir": "/home/ken/.hermes/skills"
}
Step5 - systemd で常駐化
ローカル PC では hermes serve を都度起動するだけで十分ですが、自社サーバーで運用するなら systemd user service で常駐化 が定番です。
mkdir -p ~/.config/systemd/user
cat > ~/.config/systemd/user/hermes.service <<'EOF'
[Unit]
Description=Hermes Agent Daemon
After=network.target
[Service]
ExecStart=/usr/bin/hermes serve --port 18790
Restart=on-failure
RestartSec=5
[Install]
WantedBy=default.target
EOF
systemctl --user daemon-reload
systemctl --user enable --now hermes
systemctl --user status hermes
私の3号機では port 18790 で待ち受け、Cloudflare Tunnel 経由で外部からも (認証付きで) 叩けるようにしています。
Mac mini 編 - 中小企業の社長デスクで動かす
Mac mini で動かす利点
- 電気代が圧倒的に安い (アイドル時 6-10W)
- 静音性が高い (社長デスク横に置ける)
- M4 Pro / M4 Max なら 32GB RAM で 14B級モデルが快適
セットアップ
# Homebrew で Node.js 22
brew install node@22
# Hermes 本体
curl -fsSL https://hermes-agent.org/install.sh | bash
# Ollama (Mac 用)
brew install ollama
brew services start ollama
ollama pull qwen2.5:7b
macOS では systemd ではなく launchd を使います。~/Library/LaunchAgents/com.hermes.agent.plist に launchd の plist を書く形が標準ですが、社長デスク利用なら hermes serve をターミナルで開きっぱなしにする運用でも十分です。
Windows 編 - WSL2 経由が現実解
Windows ネイティブで動かすこともできますが、実運用は WSL2 (Ubuntu) 経由が圧倒的に楽です。
# WSL2 + Ubuntu インストール (管理者 PowerShell)
wsl --install -d Ubuntu-22.04
その後は WSL2 内で Ubuntu 編と同じ手順を踏みます。Ollama も WSL2 内で動かし、GPU が必要なら CUDA on WSL2 を構成します。
Hermes Agent 構築時の落とし穴と先回り対策
落とし穴1 - 「Claudeサブスクで安く動かす」発想
Claude のサブスクライントークンを Hermes に流すと Banリスク + 規約違反 に該当します。私は Anthropic API 直接利用 に統一しています。詳細は Hermes Agentとは?Nous ResearchのOSS AIエージェント完全ガイド の Ban リスク章を併読してください。
落とし穴2 - メモリと API キーの取り違え
Tier1-3 memory がローカルに保存される一方、API キー (Anthropic / OpenAI / Gemini) は ~/.hermes/config.json に平文で書かれることが多い。1Password CLI 経由 or op:// 参照に置き換える のが社内運用の正解。私は ~/.claude.env と同じ方針で op inject 経由に統一しています。
落とし穴3 - メイン本番との混入事故
Hermes (副系) が Claude Code (本番) のディレクトリを触ると、せっかくのリスク分離が崩壊します。古田スタックでは:
- Hermes 用ワーキングディレクトリは
~/hermes-work/に物理隔離 - 全コミットメッセージに
[Hermes-PoC]プレフィックスを強制 - 本番リポジトリへの直接 push は禁止 (PR 経由のみ)
を運用ルールとして強制しています。
落とし穴4 - 自動アップデートで動かなくなる
Hermes は活発に開発中で、週次〜隔週で破壊的変更が混入することがあります。hermes self-update を systemd の自動実行に組み込まない。手動で「アップデート → 動作確認 → 本採用」のサイクルを必ず挟むこと。
古田スタックでの Hermes 運用実例 (2026-05-23時点)
- 稼働マシン: 3号機 (Ubuntu 22.04 + RTX 3090 24GB)
- 常駐方法: systemd user service / port 18790
- メイン LLM: Claude Sonnet 4.6 (API直接利用)
- ローカル LLM: Ollama qwen2.5-coder:14b
- 担当業務:
- ブログ草稿の前段生成 (機密度低 / 量が多い)
- SEO 診断レポートの中間バッチ処理
- Discord 経由のスマホからの軽量タスク指示
- Claude Code との分離: 完全別マシン (本番=1号機 / Hermes=3号機)
- 月次コスト: 電気代 + Claude API 直 + Mac mini 用ストレージ追加 = 約2万円
FAQ - Hermes Agent 構築でよくある質問
Q1. Mac mini と Ubuntu サーバー、どっち先に組むべき?
中小企業の社長一人運用なら Mac mini M4 (32GB) が最初の1台として最適。静音・低消費電力・整備済品なら15万円前後で手に入ります。ローカル LLM を本格運用するフェーズに入ったら Ubuntu + RTX 3090 機を追加。
Q2. RTX 3090 と RTX 4070 どちらがおすすめ?
RTX 3090 中古 (24GB VRAM) が圧倒的にコスパ良好。新品 RTX 4070 (12GB) は VRAM 不足で 13B 以上のローカル LLM が動かしにくい。中古 3090 は2026年5月時点で10-15万円で入手可能。
Q3. クラウドで動かしたら駄目?
駄目ではないが、Hermes の本来価値であるローカル LLM + 永続メモリ + 完全制御 を活かすなら自社サーバーが本筋。クラウドは「お試し」段階か、社員にスマホ経由で配布したい場合に。
Q4. Hermes Agent を構築したら、Claude Code は不要になる?
なりません。Claude Code が本番、Hermes が実験場と副系の役割分担が現役運用者の答えです。詳細は Claude Codeとは?経営者・非エンジニア向け完全ガイド を参照してください。
Q5. 構築のサポートはお願いできますか?
37Design では Hermes Agent / OpenClaw / Claude Code を含む AI エージェント基盤の構築支援を AI 顧問サービスで提供しています。Mac mini 1台での導入から自社サーバー (Ubuntu + GPU) の本格運用設計までワンストップ対応します。
まとめ - Hermes Agent の自社サーバー構築は20-30万円で始められる
Hermes Agent をクラウドではなく自社サーバーで構築する道筋は、2026年5月時点で 「20-30万円のハードウェア + 月2万円の運用コスト」 で十分現実的なラインに収まります。Mac mini なら社長デスク横、Ubuntu + RTX 3090 なら社内サーバールームの一角に置ける規模です。
経営者・エンジニアが今やるべき3アクション:
- Mac mini M4 (32GB) または中古 RTX 3090 機を1台確保
- 公式ワンライナーで Hermes Agent v0.13.0 をインストール
- systemd user service で常駐化 + Claude Code との物理分離設計
関連記事