2025/06/29

Software development by multi agent like a MAGI

What is MAGI?

NERV本部施設の運用やEVAシリーズのサポート、第3新東京市の市政に利用されている、スーパーコンピュータシステム。第7世代有機コンピュータとされる。メルキオール（MELCHIOR）、バルタザール（BALTHASAR）、カスパー（CASPER）という3つの独立したシステムによる合議制をとり[注 9]、人間の持つジレンマを再現している。

ref: wikipedia - マギシステム

Claude CodeでMulti agent開発をさせたくて, ritsuko, MELCHIOR, BALTHASAR, CASPERのpaneを作って、ritsuko claudeに３つのpane(MELCHIOR, BALTHASAR, CASPER)をそれぞれclaudeを起動して、ソフトウェア開発をしてとお願いだけしてさせた。
全ての意思決定は3人でさせてと頼んだ。

個人的にもうちょっと環境整備が必要そう。

問題点

1. How to make agent to do work continuously
これは、dangerously skip permissionsでauto approveで走らせられるが如何せん、3人で結託してlocal pcを壊されても怖いのでclaudeが叩けるコマンドのblack list整備やsand box環境で走らせる仕組みが必要だなーと。

で、もう一つは、ずーっと作業し続けずに、「これで指示完了しました！」とか「MELCHIORの作業を待っています。」とかで作業を辞めちゃう。これはプロンプトとかで回避可能？
ユーザーのinputを待たずに、常に何かしら動作するみたいな仕組み必要。もしくはAI同士が常にpingし合ってるみたいな。この辺はa2aとかで行ける？

2. Communication between agent and agent
tmuxを直接いじらせてagent間やり取りさせていたので、あんまり疎通方法がよくない、mcpとかa2aで繋いでagent から agentへpush(ないしpull)が安定してできる環境が必要そう。

mcpはmcpでtoolsを明示的に叩かせるのにプロンプトの工夫がちょっと必要な感覚。

Overview

10分くらいセルフapproveして作らせていた。
作ってたのは、中小企業向けの顧客管理システム。
とまぁ、日本のSaaSスタートアップがBtoBビジネス展開して、営業企業になって手堅くARR伸ばしながら成り上がっている写像になった。

技術選定は、
- Frontend
- Next.js 14 + Typescript + TailwindCSS
- Backend
- NestJS + Prisma + PostgreSQL

TypescriptがチョイスされるのはAIぽい、Next.jsは14なのもまたAIぽい（ネットの情報量的に多い？）。NestJSはその点ちょい意外、ts server side界隈よくわからんけどあんまり技術選定で見ることない気がする。prisma, postgreは順当という感じ。(AIに技術選定させて選んだ技術が一番ai friendlyな技術とは言えないが)

割とマルチセッションでAIにタスク並行でやらせてるみたいなSNS受けするAI驚き屋の投稿はよく見るが、それでこういうソフトができましたみたいなのは見ない。むしろ玄人エンジニアの人がAIでアイデアをポンポンアウトプットしているところをよく見る。

ので、現状は、AIで置き換えられてるわけではなくて、個人がAIを使って出せるアウトプットは個人の能力で頭打ちはするがAIで生産性が爆発的に上がってシニアとジュニアのアウトプットの差がより広がっているように見える。

AI同士の協業のエコシステムとLLMの性能の上昇の両翼が上がればまたパラダイムシフトするかもなという所感はあるが、まだ遠いなという印象でした。