BLOG

Engineer Post

ALL Engineer Post Designer Post PM Post Business Post Case Study

Engineer Post|2026-07-09|5 min

Anthropic Mythos Deep Dive: API Specs and Claude Harness Benchmark

A hands-on engineering guide to Anthropic Mythos: API specs, model characteristics, and how it differs from existing Claude models when benchmarked via evaluation harness.

Engineer Post|2026-07-09|5 min

Chatbot Accuracy Measurement and Improvement: RAG Metrics and Harness Evaluation Loop

How to define and measure chatbot accuracy in 2026. This article organizes RAG accuracy metrics and harness evaluation loop design from an implementation perspective, covering everything from metric definition to improvement cycles.

Engineer Post|2026-07-09|5 min

Fable5 Anthropic Deep Dive: API Spec, Model Traits, and Claude Harness Comparison

A deep engineering dive into Anthropic's Fable5: API spec, model traits, and harness-based comparison with Claude Opus/Sonnet, plus enterprise selection criteria for 2026.

Engineer Post|2026-07-09|5 min

Why Claude Mythos Is Called Insane: Benchmarks and Real-World Verification

We verify why Anthropic's Claude Mythos is called 'insane' from three angles: benchmarks, hands-on implementation, and business applicability, separating hype from actual capability.

Engineer Post|2026-06-05|5 min

MCP Integration Patterns for Enterprise: 3-Layer Architecture with Claude, SaaS, and Internal DB

A practical guide to MCP integration patterns for enterprise systems, covering 3-layer architecture (Claude, external SaaS, internal DB) and access control design based on 2026 operational insights.

Engineer Post|2026-06-05|5 min

JavaScript filter() Practical Patterns for Business Systems

From basics to compound conditions and performance comparison, this article breaks down 10 practical filter() patterns for business JavaScript with real code examples.

Engineer Post|2026-06-05|5 min

Matsuo Lab LLM Course 2025 Slides: Key Points for Engineers

A practical breakdown of the 2025 Matsuo Lab LLM lecture slides from a business engineer's perspective. Chapter-by-chapter takeaways on Transformers, RAG, evaluation, and agents for real implementation.

Engineer Post|2026-06-05|5 min

What is RAG? Architecture, Business Use Cases and Hallucination Control

RAG stands for Retrieval-Augmented Generation. This article explains its architecture, vector search and embeddings, business use cases, and how it reduces hallucinations from an implementation perspective.

Engineer Post|2026-06-04|5 min

Claude 4.8 Opus Deep Dive: High-Difficulty Tasks and Sonnet Comparison Harness

A practical deep-dive into Claude 4.8 Opus: release trends, high-difficulty business use cases, and how to design a comparison harness against Sonnet for production deployment decisions.

Engineer Post|2026-05-26|5 min read

Business Systems vs Core Systems: 2026 Modernization Guide

A practical guide for Japanese enterprises to clarify the difference between business systems and core (ERP) systems, with 2026 modernization criteria and AI integration architecture patterns.

Engineer Post|2026-05-22|5 min

AI-Driven Development Tools 2026: Cursor, Claude Code, Devin, Copilot Compared by Workflow

AI-driven development tools have entered the era of the big four: Cursor, Claude Code, Devin, and Copilot. We compare them across the development lifecycle and explain selection criteria and cost estimation for enterprise adoption.

Engineer Post|2026-05-22|5 min

RPA Engineer Career Redesign for the AI Era

We break down what RPA engineers actually do in 2026 and present a concrete roadmap to extend their skills toward generative AI and agent implementation, with skill maps and career strategies.

Engineer Post|2026-05-22|5 min

Harness Engineering with OpenAI: Implementation Patterns for Evals and GPT Models

A practical guide to harness engineering with OpenAI: implementation patterns using OpenAI Evals, GPT models, and key differences from Claude-based harnesses for production-grade evaluation loops.

Engineer Post|2026-05-22|5 min

Anthropic API Implementation Guide 2026: Auth, Model Selection, Rate Limits, and Cost Optimization

A practical guide to integrating Anthropic API into business systems in 2026: authentication, model selection across Claude 3.5/4 series, rate limiting, and cost optimization—with implementation code and operational patterns.

Engineer Post|2026-05-22|5 min

Claude Harness Design Practical Guide: Eval Axes, Datasets, and Automated Scoring

A practical guide to designing evaluation harnesses for Claude API in production AI systems, covering evaluation axes, dataset design, and automated scoring with real code examples as of May 2026.

Engineer Post|2026-05-22|5 min

Claude Code Harness Engineering: CI Loop, Regression Eval, and Production Monitoring

A practical guide to harness engineering on Claude Code, organized around CI loops, regression evaluation, and production monitoring. Includes code examples and operational frameworks tailored for enterprise adoption in 2026.

Engineer Post|2026-05-22|5 min

Claude Code Harness Design: 3-Layer Implementation Guide

A practical guide to designing evaluation harnesses for Claude Code in production: three layers covering eval data preparation, execution loops, and automated scoring with code examples from 2026 field practice.

Engineer Post|2026-05-22|5 min

Anthropic Console Practical Guide 2026: API Keys, Workbench, and Usage Monitoring for Business Operations

A practical guide to Anthropic Console from a business operations perspective. We cover API key management, Workbench, usage and cost monitoring, Evals, and organization management based on real implementation experience.

Engineer Post|2026-05-22|5 min

AI-Driven Development Primer: Start Today with a Minimal Workflow

An introductory guide to AI-driven development covering core concepts and a minimal workflow you can implement today using Claude Code and Cursor, with practical code examples.

Engineer Post|2026-05-14|5 min

Harness Engineering with Claude API: Sonnet vs Opus Evaluation Guide

A practical guide to implementing harness evaluation with Claude API. Covers Sonnet/Opus accuracy comparison, LLM-as-a-Judge design, and cost optimization with real code examples for production use cases.

Engineer Post|2026-05-08|5 min

Claude Code on VSCode via AWS Bedrock: Enterprise Setup Guide

A practical guide to running Claude Code through AWS Bedrock via VSCode, balancing data sovereignty and cost control for enterprises. Learn IAM role design, cost allocation strategies, and model-switching patterns based on real-world implementation experience.

10 Practical Claude Prompts for Slide Creation: From Outline to HTML Output

Engineer Post|2026-05-08|5 min

Engineer Post

Anthropic Mythos Deep Dive: API Specs and Claude Harness Benchmark

Chatbot Accuracy Measurement and Improvement: RAG Metrics and Harness Evaluation Loop

Fable5 Anthropic Deep Dive: API Spec, Model Traits, and Claude Harness Comparison

Why Claude Mythos Is Called Insane: Benchmarks and Real-World Verification

MCP Integration Patterns for Enterprise: 3-Layer Architecture with Claude, SaaS, and Internal DB

JavaScript filter() Practical Patterns for Business Systems

Matsuo Lab LLM Course 2025 Slides: Key Points for Engineers

What is RAG? Architecture, Business Use Cases and Hallucination Control

Claude 4.8 Opus Deep Dive: High-Difficulty Tasks and Sonnet Comparison Harness

Business Systems vs Core Systems: 2026 Modernization Guide

AI-Driven Development Tools 2026: Cursor, Claude Code, Devin, Copilot Compared by Workflow

RPA Engineer Career Redesign for the AI Era

Harness Engineering with OpenAI: Implementation Patterns for Evals and GPT Models

Anthropic API Implementation Guide 2026: Auth, Model Selection, Rate Limits, and Cost Optimization

Claude Harness Design Practical Guide: Eval Axes, Datasets, and Automated Scoring

Claude Code Harness Engineering: CI Loop, Regression Eval, and Production Monitoring

Claude Code Harness Design: 3-Layer Implementation Guide

Anthropic Console Practical Guide 2026: API Keys, Workbench, and Usage Monitoring for Business Operations

AI-Driven Development Primer: Start Today with a Minimal Workflow

Harness Engineering with Claude API: Sonnet vs Opus Evaluation Guide

Claude Code on VSCode via AWS Bedrock: Enterprise Setup Guide

10 Practical Claude Prompts for Slide Creation: From Outline to HTML Output

Harness Engineering Meets TDD: Designing Evaluation Loops for AI Agents

Practical Harness Engineering Guide 2026: From Eval Harness Build to Production