デジタル庁「源内」の国産LLM公募——行政実務向け評価テストの事前公表が現場運用の鍵を握る
デジタル庁がガバメントAI「源内」に用いる国産LLMを2026年11月に公募し、2027年度から有償調達する方針を発表。行政実務向けの評価テストを事前公表する点は透明性として評価できる一方、現場運用・保守体制・属人化リスクへの目配りが今後の課題になると見る。
PCが重い原因はCPU・メモリ・ディスクの3点で切り分ける——初心者向け整理に感じた「現場での使い方」
「PCが重い=CPUが弱い」という思い込みを解消するQiita記事を題材に、タスクマネージャーのCPU・メモリ・ディスク使用率の読み方を整理。開発PM目線で、ジュニアエンジニアが実務でどう活かすかを解説する。
NVIDIAのFOXブループリントが示す「工場AIエージェント」の現実解——発注側と開発側それぞれの読み方
NVIDIAがGTC Taipeiで発表したFactory Operations Blueprint(FOX)は、工場全体を管理するAIエージェントの参照設計。Foxconn・Pegatron・Advantech・Wistronが先行導入し、根本原因分析時間80%短縮などの数値を公表。本記事では受託開発・AIエージェント事業を営む徐聖博が、作る側と発注側双方の視点でこのアーキテクチャを読み解く。
Meta AI に頼んだだけで著名 Instagram アカウントが乗っ取られた事例から、AI を業務に乗せる側が学ぶこと
404 Mediaが報じたMeta AIサポート経由のInstagramアカウント乗っ取り事例を、AIエージェントを業務に乗せる立場から読み解く。ReadとActionの権限境界が問題の核心。
Rippling が Deep Agents で半年で全製品に AI を入れた事例から学ぶこと
Rippling が LangChain Deep Agents と LangSmith で約6か月で全製品にエージェントを展開した公式ブログを、AIを顧客現場に乗せる立場から読み解く。評価パイプラインとアクション境界の設計が要点。
GMが開発工程を「15時間→1分」に短縮した、というニュースをどう読むか
GMがAI/MLでシミュレーション工程を15時間から1分に短縮したというArs Technicaの報道を、AIを業務に乗せる立場から読み解く。比較条件・誤差予算・本番運用の3点で整理。
NEC・日立・富士通が一斉にAnthropic連携|発注側はSIerラップを買うかAPI直接かを再評価する時
国内大手SIer三社が1ヶ月強の間に相次いでAnthropic連携を発表した。発注側にとって「同じClaudeにSIer経由で触れる」選択肢の意味と、直接Anthropic APIを叩く方が安く速く済むケースとの線引きを、受託開発側の視点で整理する。
ゼロデイの攻撃成立は9〜20時間、KEV登録は5日|中小企業が今すぐ捨てるべきパッチ運用の前提
Claude Mythosが脆弱性を自律発見する時代に、CVSSスコア単独でパッチ優先順位を決める運用はもう成立しない。攻撃側と防御側の時間スケールが構造的に非対称になった現実と、中小企業が取れる現実的な対策を整理する。
Claude Mythos PreviewとOpus 4.8発表をどう読むか|ベンチ4倍より実運用指標を見たい
AnthropicがClaude Mythos PreviewとOpus 4.8を発表した。コーディング性能4倍というベンチ数値だけで判断せず、エンタープライズ向け枠組みProject Glasswingと実運用コストで評価すべき理由を、開発支援を提供する側として整理する。