デジタル庁「源内」の国産LLM公募——行政実務向け評価テストの事前公表が現場運用の鍵を握る
デジタル庁がガバメントAI「源内」に用いる国産LLMを2026年11月に公募し、2027年度から有償調達する方針を発表。行政実務向けの評価テストを事前公表する点は透明性として評価できる一方、現場運用・保守体制・属人化リスクへの目配りが今後の課題になると見る。
NVIDIAのFOXブループリントが示す「工場AIエージェント」の現実解——発注側と開発側それぞれの読み方
NVIDIAがGTC Taipeiで発表したFactory Operations Blueprint(FOX)は、工場全体を管理するAIエージェントの参照設計。Foxconn・Pegatron・Advantech・Wistronが先行導入し、根本原因分析時間80%短縮などの数値を公表。本記事では受託開発・AIエージェント事業を営む徐聖博が、作る側と発注側双方の視点でこのアーキテクチャを読み解く。
Meta AI に頼んだだけで著名 Instagram アカウントが乗っ取られた事例から、AI を業務に乗せる側が学ぶこと
404 Mediaが報じたMeta AIサポート経由のInstagramアカウント乗っ取り事例を、AIエージェントを業務に乗せる立場から読み解く。ReadとActionの権限境界が問題の核心。
Rippling が Deep Agents で半年で全製品に AI を入れた事例から学ぶこと
Rippling が LangChain Deep Agents と LangSmith で約6か月で全製品にエージェントを展開した公式ブログを、AIを顧客現場に乗せる立場から読み解く。評価パイプラインとアクション境界の設計が要点。
GMが開発工程を「15時間→1分」に短縮した、というニュースをどう読むか
GMがAI/MLでシミュレーション工程を15時間から1分に短縮したというArs Technicaの報道を、AIを業務に乗せる立場から読み解く。比較条件・誤差予算・本番運用の3点で整理。
ゼロデイの攻撃成立は9〜20時間、KEV登録は5日|中小企業が今すぐ捨てるべきパッチ運用の前提
Claude Mythosが脆弱性を自律発見する時代に、CVSSスコア単独でパッチ優先順位を決める運用はもう成立しない。攻撃側と防御側の時間スケールが構造的に非対称になった現実と、中小企業が取れる現実的な対策を整理する。
Claude Mythos PreviewとOpus 4.8発表をどう読むか|ベンチ4倍より実運用指標を見たい
AnthropicがClaude Mythos PreviewとOpus 4.8を発表した。コーディング性能4倍というベンチ数値だけで判断せず、エンタープライズ向け枠組みProject Glasswingと実運用コストで評価すべき理由を、開発支援を提供する側として整理する。
AI搭載ブラウザ続々登場をどう見るか|中小企業は「乗り換え」より情報管理の見直しを
2026年、Chrome・Safari対抗のAI搭載ブラウザが続々登場しています。Comet・Atlas・Diaなどエージェント機能を備える一方、業務データへのアクセス範囲という新たな論点も。発注側・中小企業の視点で、流行に飛びつく前に考えるべき情報管理の観点を整理します。
Gemini Spark実機レビューをどう見るか|「あると便利」止まりのAIエージェントを業務でどう扱うか
Google Gemini Sparkの実機レビューが公開されました。買い物リサーチや定期タスクで実力を見せた一方、精度や連携面の課題も露呈。発注側・中小企業の視点で、まだ「必須」ではなく「あると便利」段階のAIエージェントを業務でどう扱うべきかを整理します。