AI

Hermes Agent 自社サーバー構築完全ガイド|Mac mini/Ubuntu+RTX 3090実装で経営者が試す手順【2026年最新】

週77時間Claude Codeで会社を動かすAI社長が、3号機(Ubuntu+RTX 3090)で運用中のHermes Agentを「自社サーバー構築」の実体験で解説。クラウドではなくオンプレ前提のセットアップ、Ollama連携、systemd常駐、Banリスク回避、Mac mini/Ubuntu/Windows別の最短手順を2026年最新版で公開。

執筆者: 古田 健

株式会社37Design 代表取締役 / 14プロダクト運用中の現役AI顧問

こんにちは、37Design代表の古田です。週77時間Claude Codeを使うAI社長 として、自社で14プロダクトを並走運用しています (直近1週間ピーク値、月300時間到達が次の目標)。

私の37Designでは、3号機 (Ubuntu + RTX 3090 24GB) に Hermes Agent v0.13.0 を PoC 運用しています。Claude Code をメイン本番に置きつつ、Hermes は 副系の実験場兼ローカル推論ボックスとして走らせている構成です。

「Hermes Agent を自社で構築したいけど、クラウドデプロイ系の解説 (Zeabur / Tencent / NocoBase) ばかりで、オンプレ実装の具体的な手順がまとまっていない」「Mac mini か Ubuntu か、ローカルマシンで動かす場合の選び方が分からない」「systemd で常駐させるベストプラクティスは?」——2026年5月時点で経営者・エンジニアからもらう質問の中身です。

この記事では、3号機 + RTX 3090 で Hermes Agent を実運用している立場から、Mac mini / Ubuntu / Windows それぞれの自社サーバー構築手順、Ollama 連携、systemd 常駐化、Banリスク回避を体系的に解説します。クラウドデプロイ前提の既存記事では拾えない「自前ハードで本気で動かす」視点に絞った日本語ガイドです。

Hermes Agent そのものの概要や Nous Research 背景は Hermes Agentとは?Nous ResearchのOSS AIエージェント完全ガイド を、近縁の OSS は OpenClawとは?Claude Code互換OSSエージェント完全ガイド を併読してください。


自社サーバー構築の前提 - なぜクラウドではなくオンプレなのか

結論 - Hermes は「自宅 or 自社サーバーで常駐」が本来の使い方

Zeabur / Tencent Cloud / NocoBase のクラウドデプロイガイドが先行していますが、Hermes Agent の本来の強みは「自分が完全に支配できる環境で動かす」こと にあります。理由は3点です。

  1. 永続メモリと自動スキル生成はローカル運用が大前提 - Hermes の Tier1-3 memory は時間をかけて育つ資産。クラウドベンダー依存になると移行コストが跳ねる
  2. Ollama 連携でローカル LLM を併用できるのが旨味 - 機密度の高いタスクは GPU 搭載マシンで完結させたい
  3. Claude Code との分離運用には自社制御が必須 - メイン本番 (Claude Code) と副系 (Hermes) を物理サーバー単位で分けたい

必要なスペック - 用途別の現実的ライン

用途推奨スペックコメント
お試し PoC (CPU推論のみ)Mac mini M2 / 16GB RAM軽量タスク・スキル試作までは十分
軽量本番運用 (8B以下のLLM)Mac mini M4 Pro / 32GB RAMOllama 8B級なら実用速度
本気のローカルLLM運用 (13-30B)Ubuntu + RTX 3090 24GB古田スタックの3号機構成
大規模ローカル運用 (70B+)デュアル RTX 3090 / RTX 4090月数十万円コース、ROI注意

私の3号機 (ASRock B450 + RTX 3090) は中古パーツで20万円前後で組めました。Mac mini M4 (整備済品) も同価格帯。「自社サーバー構築」のハードル金額は20-30万円と現実的なラインに収まります。


Hermes Agent の構築手順 - Ubuntu Server 編 (最推奨)

Step1 - 動作環境の準備

私の3号機 (Ubuntu 22.04 LTS) では次の構成で動かしています。

# Node.js v22 LTS (Hermes は v22+ を要求)
curl -fsSL https://deb.nodesource.com/setup_22.x | sudo -E bash -
sudo apt-get install -y nodejs

# CUDA (RTX 3090 用 / Ollama GPU推論)
sudo apt install nvidia-driver-535 nvidia-cuda-toolkit

# Docker (オプション、コンテナ化したい場合)
sudo apt install docker.io docker-compose
sudo usermod -aG docker $USER

GPU 不要の構成 (Mac mini 等) なら CUDA セクションは飛ばし、Ollama だけ後段で入れます。

Step2 - Hermes Agent 本体のインストール

# 公式ワンライナー (推奨ルート)
curl -fsSL https://hermes-agent.org/install.sh | bash

# または npm 経由
npm install -g @nousresearch/hermes-agent

# バージョン確認
hermes --version
# Hermes Agent v0.13.0

hermes setup を実行すると、対話形式でモデル選択と API キー登録ができます。

Step3 - LLM プロバイダー設定

私の3号機では 2系統併用 で組んでいます。

  • メイン: Anthropic Claude API (Sonnet 4.6 / Opus 4.7) - 高精度が必要なタスク
  • サブ: Ollama (qwen2.5-coder:14b) - 機密度が高い or 大量バッチ処理
# Ollama のインストール
curl -fsSL https://ollama.com/install.sh | sh

# モデルの取得 (14Bは RTX 3090で快適)
ollama pull qwen2.5-coder:14b
ollama pull llama3.1:8b

Step4 - 設定ファイルの基本構造

~/.hermes/config.json に必要最低限の設定を書き込みます。

{
  "providers": {
    "anthropic": {
      "api_key": "sk-ant-...",
      "default_model": "claude-sonnet-4-6"
    },
    "ollama": {
      "host": "http://localhost:11434",
      "default_model": "qwen2.5-coder:14b"
    }
  },
  "memory": {
    "tier1_short": 50,
    "tier2_mid": 500,
    "tier3_long": "unlimited"
  },
  "skills_dir": "/home/ken/.hermes/skills"
}

Step5 - systemd で常駐化

ローカル PC では hermes serve を都度起動するだけで十分ですが、自社サーバーで運用するなら systemd user service で常駐化 が定番です。

mkdir -p ~/.config/systemd/user
cat > ~/.config/systemd/user/hermes.service <<'EOF'
[Unit]
Description=Hermes Agent Daemon
After=network.target

[Service]
ExecStart=/usr/bin/hermes serve --port 18790
Restart=on-failure
RestartSec=5

[Install]
WantedBy=default.target
EOF

systemctl --user daemon-reload
systemctl --user enable --now hermes
systemctl --user status hermes

私の3号機では port 18790 で待ち受け、Cloudflare Tunnel 経由で外部からも (認証付きで) 叩けるようにしています。


Mac mini 編 - 中小企業の社長デスクで動かす

Mac mini で動かす利点

  • 電気代が圧倒的に安い (アイドル時 6-10W)
  • 静音性が高い (社長デスク横に置ける)
  • M4 Pro / M4 Max なら 32GB RAM で 14B級モデルが快適

セットアップ

# Homebrew で Node.js 22
brew install node@22

# Hermes 本体
curl -fsSL https://hermes-agent.org/install.sh | bash

# Ollama (Mac 用)
brew install ollama
brew services start ollama
ollama pull qwen2.5:7b

macOS では systemd ではなく launchd を使います。~/Library/LaunchAgents/com.hermes.agent.plist に launchd の plist を書く形が標準ですが、社長デスク利用なら hermes serve をターミナルで開きっぱなしにする運用でも十分です。


Windows 編 - WSL2 経由が現実解

Windows ネイティブで動かすこともできますが、実運用は WSL2 (Ubuntu) 経由が圧倒的に楽です。

# WSL2 + Ubuntu インストール (管理者 PowerShell)
wsl --install -d Ubuntu-22.04

その後は WSL2 内で Ubuntu 編と同じ手順を踏みます。Ollama も WSL2 内で動かし、GPU が必要なら CUDA on WSL2 を構成します。


Hermes Agent 構築時の落とし穴と先回り対策

落とし穴1 - 「Claudeサブスクで安く動かす」発想

Claude のサブスクライントークンを Hermes に流すと Banリスク + 規約違反 に該当します。私は Anthropic API 直接利用 に統一しています。詳細は Hermes Agentとは?Nous ResearchのOSS AIエージェント完全ガイド の Ban リスク章を併読してください。

落とし穴2 - メモリと API キーの取り違え

Tier1-3 memory がローカルに保存される一方、API キー (Anthropic / OpenAI / Gemini) は ~/.hermes/config.json に平文で書かれることが多い。1Password CLI 経由 or op:// 参照に置き換える のが社内運用の正解。私は ~/.claude.env と同じ方針で op inject 経由に統一しています。

落とし穴3 - メイン本番との混入事故

Hermes (副系) が Claude Code (本番) のディレクトリを触ると、せっかくのリスク分離が崩壊します。古田スタックでは:

  • Hermes 用ワーキングディレクトリは ~/hermes-work/ に物理隔離
  • 全コミットメッセージに [Hermes-PoC] プレフィックスを強制
  • 本番リポジトリへの直接 push は禁止 (PR 経由のみ)

を運用ルールとして強制しています。

落とし穴4 - 自動アップデートで動かなくなる

Hermes は活発に開発中で、週次〜隔週で破壊的変更が混入することがあります。hermes self-updatesystemd の自動実行に組み込まない。手動で「アップデート → 動作確認 → 本採用」のサイクルを必ず挟むこと。


古田スタックでの Hermes 運用実例 (2026-05-23時点)

  • 稼働マシン: 3号機 (Ubuntu 22.04 + RTX 3090 24GB)
  • 常駐方法: systemd user service / port 18790
  • メイン LLM: Claude Sonnet 4.6 (API直接利用)
  • ローカル LLM: Ollama qwen2.5-coder:14b
  • 担当業務:
    • ブログ草稿の前段生成 (機密度低 / 量が多い)
    • SEO 診断レポートの中間バッチ処理
    • Discord 経由のスマホからの軽量タスク指示
  • Claude Code との分離: 完全別マシン (本番=1号機 / Hermes=3号機)
  • 月次コスト: 電気代 + Claude API 直 + Mac mini 用ストレージ追加 = 約2万円

FAQ - Hermes Agent 構築でよくある質問

Q1. Mac mini と Ubuntu サーバー、どっち先に組むべき?

中小企業の社長一人運用なら Mac mini M4 (32GB) が最初の1台として最適。静音・低消費電力・整備済品なら15万円前後で手に入ります。ローカル LLM を本格運用するフェーズに入ったら Ubuntu + RTX 3090 機を追加。

Q2. RTX 3090 と RTX 4070 どちらがおすすめ?

RTX 3090 中古 (24GB VRAM) が圧倒的にコスパ良好。新品 RTX 4070 (12GB) は VRAM 不足で 13B 以上のローカル LLM が動かしにくい。中古 3090 は2026年5月時点で10-15万円で入手可能。

Q3. クラウドで動かしたら駄目?

駄目ではないが、Hermes の本来価値であるローカル LLM + 永続メモリ + 完全制御 を活かすなら自社サーバーが本筋。クラウドは「お試し」段階か、社員にスマホ経由で配布したい場合に。

Q4. Hermes Agent を構築したら、Claude Code は不要になる?

なりません。Claude Code が本番、Hermes が実験場と副系の役割分担が現役運用者の答えです。詳細は Claude Codeとは?経営者・非エンジニア向け完全ガイド を参照してください。

Q5. 構築のサポートはお願いできますか?

37Design では Hermes Agent / OpenClaw / Claude Code を含む AI エージェント基盤の構築支援を AI 顧問サービスで提供しています。Mac mini 1台での導入から自社サーバー (Ubuntu + GPU) の本格運用設計までワンストップ対応します。


まとめ - Hermes Agent の自社サーバー構築は20-30万円で始められる

Hermes Agent をクラウドではなく自社サーバーで構築する道筋は、2026年5月時点で 「20-30万円のハードウェア + 月2万円の運用コスト」 で十分現実的なラインに収まります。Mac mini なら社長デスク横、Ubuntu + RTX 3090 なら社内サーバールームの一角に置ける規模です。

経営者・エンジニアが今やるべき3アクション:

  1. Mac mini M4 (32GB) または中古 RTX 3090 機を1台確保
  2. 公式ワンライナーで Hermes Agent v0.13.0 をインストール
  3. systemd user service で常駐化 + Claude Code との物理分離設計

37Design への無料相談はこちら

AI顧問サービスの詳細はこちら


関連記事

こんな記事も読まれています

AI顧問サービス|月額3万円〜

記事を読むだけで終わらせず、御社の業務に実装しませんか?

37DesignのAI顧問なら、ツール選定から構築・運用改善まで一気通貫で伴走。 14プロダクトを運用する現役AI顧問が、月額3万円から「動く仕組み」を作ります。

初期費用10万円・月額3万円〜 / 契約期間の縛りなし / 翌月解約OK