Orchestrating Intelligence Beyond the Cloud.
Welcome to the AMEVA Ecosystem. ๋ณธ ํ๋ก์ ํธ๋ Local-first, Hierarchical AI Orchestration ๋ฐ SRE-driven Inference Infrastructure์ ๋ํ ์ฌ๋ ์๋ Research Portfolio์ ๋๋ค. Data Privacy์ Resilience, ๊ทธ๋ฆฌ๊ณ Edge-native performance๋ฅผ ์ต์ฐ์ ๊ฐ์น๋ก ์ค๊ณ๋์์ต๋๋ค.
AMEVA ์์ฝ์์คํ ์ ๋ค์ ์ธ ๊ฐ์ง ํต์ฌ Paradigm ์์ ๊ตฌ์ถ๋์์ต๋๋ค:
- Hierarchical Control: ๋จ์ํ Prompt-response ํจํด์ ๋์ด, ๊ตฌ์กฐํ๋ "Nobles & Workers" ๊ณ์ธตํ ์ ์ด๋ฅผ ์งํฅํฉ๋๋ค.
- Hardware-Software Co-Design: ๊ฐ Edge device์ Power/Compute profile์ ๊ณ ๋ คํ์ฌ Inference ๊ณผ์ ์ ์ต์ ํํฉ๋๋ค.
- Reliability by Design: AI ์ถ๋ก ๊ณผ์ ์ ํ๋์ Mission-critical utility๋ก ๊ฐ์ฃผํ๊ณ , Site Reliability Engineering (SRE) ์์น์ ์ ์ฉํฉ๋๋ค.
| Project | Role in Ecosystem | Core Innovation |
|---|---|---|
| Agent Orchestra | Orchestrator | Hierarchical task decomposition & Agent management |
| Model Nexus | Infrastructure | Unified API gateway with SRE-based dynamic throttling |
| Benchmark Suite | Validation | Empirical power/performance profiling for edge hardware |
| Doc AI | Interface | Privacy-first offline document intelligence pipeline |
| Conductor | Control | Remote cross-platform UI for human-agent interaction |
| Data Harvester | Data Layer | Hyper-resilient, zero-loss edge forwarder with multi-transport backup |
| Database | Analytics | Lightweight SQLite & log inspector for distributed AMEVA ecosystem |
| STT Trainer | Perception | Whisper-based Korean STT with LoRA fine-tuning |
| STT Agent | Perception | Speech recognition agent integration |
| Window Assistant | Interface | Windows-native local AI desktop assistant with OCR-first screen understanding |
| Dead Internet Theatre | Simulation | Fully autonomous Docker-based multi-agent simulation |
| BitNet | Optimization | BitNet inference framework with ARM/Exynos scalar fallback |
ํ๋ LLM์ Long-context ๋ด์์์ "๋ง๊ฐ" ํ์์ ๊ฒช์ต๋๋ค. Agent Orchestra๋ User intent๋ฅผ **Nobles (์์ฌ๊ฒฐ์ ๋ ์ด์ด)**๋ก ์ถ์ํํ๊ณ , ์ด๋ฅผ ์์ ๋จ์์ ์๋ธ ํ์คํฌ๋ก ์ชผ๊ฐ์ด ์ ๋ฌธํ๋ Workers์๊ฒ ์์ํจ์ผ๋ก์จ ์ด๋ฅผ ํด๊ฒฐํฉ๋๋ค.
- Research Focus: Multi-turn ์ค์ผ์คํธ๋ ์ด์ ๊ณผ์ ์์์ "Semantic Drift" ์ต์ํ
- Key Implementation: ๋ก์ปฌ GGUF ๋ชจ๋ธ์ ์ต์ ํ๋ Graph-based state management ์์คํ
์ ํ๋ ๋ฆฌ์์ค ํ๊ฒฝ์์ ์ด๋ป๊ฒ ์์ ์ ์ผ๋ก AI๋ฅผ ์๋นํ ๊ฒ์ธ๊ฐ? Model Nexus๋ ๋ชจ๋ธ์ ๊ฐ์ํ๋ ๋ฆฌ์์ค๋ก ์ทจ๊ธํฉ๋๋ค.
- Dynamic Scoped-Throttling: ํ์ฌ ํ๋์จ์ด์ ์จ๋ ๋ฐ Power draw๋ฅผ ์ค์๊ฐ์ผ๋ก ๊ฐ์งํ์ฌ Context window์ Sampling ํ๋ผ๋ฏธํฐ๋ฅผ ๋์ ์ผ๋ก ์กฐ์ ํฉ๋๋ค
- High-Availability Serving: ๋ณต์กํ Agent ์์ฒญ์ด ๋จ์ ์ง์๋ณด๋ค ์ฐ์ ์ฒ๋ฆฌ๋ ์ ์๋๋ก ์ค์ผ์ค๋งํฉ๋๋ค
"์ธก์ ํ ์ ์์ผ๋ฉด ๊ฐ์ ํ ์ ์๋ค." ๋ณธ Suite๋ ๋ชจ๋ AMEVA ์ต์ ํ์ ๊ธฐ์ ์ ๊ทผ๊ฑฐ(Empirical foundation)๋ฅผ ์ ๊ณตํฉ๋๋ค.
- Synchronized Power Tracking: TPS(Tokens Per Second)์ mW(Milliwatt) ์๋ชจ๋์ ๋๊ธฐํํ์ฌ ๋ถ์ํ๋ "Greener AI"์ ์ฒซ๊ฑธ์์ ๋๋ค
๋ฐ์ดํฐ ์์ค ์๋ ๊ทน๋์ ๋ณต์๋ ฅ. ๋ฐ์ดํฐ๋ฒ ์ด์ค ์์ด ์ฃ์ง์์ ์ง์ ํ์ด๋ธ๋ฆฌ๋ ์ ์ก ๊ฒฝ๋ก๋ฅผ ํตํด ๋ฐ์ดํฐ๋ฅผ ์์งํฉ๋๋ค.
- Multi-Transport Backup: SCP, HTTPS, Telegram Bot์ ํตํ ์๋ ํด๋ฐฑ
- Payload Validation: ์ ๋ก ๋ก์ค ๊ฒ์ฆ ๋ฉ์ปค๋์ฆ์ผ๋ก ๋ฐ์ดํฐ ๋ฌด๊ฒฐ์ฑ ๋ณด์ฅ
Whisper ๊ธฐ๋ฐ LoRA ํ์ธ ํ๋์ผ๋ก ํ๊ตญ์ด ํนํ ์์ฑ ์ธ์์ ๊ตฌํํฉ๋๋ค.
- STT Trainer: ๋ฐ์ดํฐ ์คํฌ๋ํ๋ถํฐ ๋ชจ๋ธ ๋ณํฉ๊น์ง ์ ์ฒด ํ์ดํ๋ผ์ธ ์ ๊ณต
- STT Agent: Edge device์์ ์ค์๊ฐ ์์ฑ ์ฒ๋ฆฌ ๋ฐ ํตํฉ
Windows ๋ฐ์คํฌํฑ AI ์ด์์คํดํธ๋ก, ํ๋ฉด ์ดํด๋ฅผ OCR ๊ธฐ๋ฐ์ผ๋ก ์ฐ์ ์ฒ๋ฆฌํฉ๋๋ค.
- Multimodal Fallback: OCR ์คํจ ์ Vision ๋ชจ๋ธ๋ก ์๋ ์ ํ
- Offline Voice I/O: ์์ ์คํ๋ผ์ธ ์์ฑ ์ ์ถ๋ ฅ
- llama.cpp Integration: ๋ก์ปฌ ์ถ๋ก ์์ง ํตํฉ
๋ณต์กํ Agentic workflow๋ฅผ 100% ์คํ๋ผ์ธ ํ๊ฒฝ์์ ๊ตฌํ ์๋ฃ. Local model fine-tuning์ ํตํ Data sovereignty ํ๋ณด.
Federated Inference ๋์ . ๋ก์ปฌ ๋คํธ์ํฌ ๋ด์ ์ฌ๋ฌ ์ฃ์ง ๋๋ฐ์ด์ค ๊ฐ์ฉ VRAM์ ํ๋ง(Pooling)ํ์ฌ, ๋จ์ผ ๊ธฐ๊ธฐ์์ ๋ถ๊ฐ๋ฅํ๋ ๋ํ ๋ชจ๋ธ(30B+)์ ๋ถ์ฐ ์ฒ๋ฆฌํ๋ ๊ธฐ์ ์ฐ๊ตฌ.
๋จ์ํ ์ํ์ ๋์ด, Benchmark Suite์ ๊ณผ๊ฑฐ ๋ฐ์ดํฐ๋ฅผ ํ์ตํ์ฌ ์ค์ค๋ก ์ฝ๋์ ์ธํ๋ผ๋ฅผ ์ต์ ํ(Self-optimization)ํ๋ ์์จํ Self-healing AI ์์ด์ ํธ ์์คํ ๊ตฌ์ถ.
| Term | Definition |
|---|---|
| Orchestration | ๋ณต์กํ ์์คํ ์ด๋ ์ฌ๋ฌ ์์ด์ ํธ์ ๋์์ ์กฐํ๋กญ๊ฒ ์ ์ดํ๊ณ ๊ด๋ฆฌํ๋ ๊ณผ์ |
| Hierarchical | ๊ณ์ธต์ ์ธ ์์คํ ๊ตฌ์กฐ. ์์ ๋ ์ด์ด๊ฐ ์ ๋ต์ ์ง๊ณ ํ์ ๋ ์ด์ด๊ฐ ์คํํ๋ ๋ฐฉ์ |
| Edge-AI | ๋ฐ์ดํฐ ์ผํฐ(ํด๋ผ์ฐ๋)๊ฐ ์๋ ์ฌ์ฉ์์ ๊ฐ๊น์ด ๊ธฐ๊ธฐ(์ฃ์ง)์์ ์ง์ AI๋ฅผ ๊ตฌ๋ํ๋ ๊ธฐ์ |
| Inference | ํ์ต๋ AI ๋ชจ๋ธ์ ํตํด ๊ฒฐ๊ณผ๊ฐ์ ๋์ถํด๋ด๋ ์ถ๋ก (์คํ) ๊ณผ์ |
| SRE | Site Reliability Engineering - ์์คํ ์ ์์ ์ฑ๊ณผ ์ ๋ขฐ์ฑ์ ๋์ด๊ธฐ ์ํด ์ํํธ์จ์ด ๊ณตํ ๊ธฐ๋ฒ์ ์ธํ๋ผ ์ด์์ ์ ์ฉํ๋ ๋ฐฉ๋ฒ๋ก |
| Sovereignty | ๋ฐ์ดํฐ๋ ์์คํ ์ ๋ํ ์์ ํ ํต์ ๊ถ ๋ฐ ์ฃผ๊ถ |
| Throttling | ์์ ๊ณผ๋ถํ๋ฅผ ๋ง๊ธฐ ์ํด ์๋์ ์ผ๋ก ์ฒ๋ฆฌ ์๋๋ ์์ฒญ์ ์กฐ์ ํ๋ ๊ธฐ์ |
| Semantic Drift | ๋ํ๋ ์์ ์ด ๊ธธ์ด์ง์๋ก AI๊ฐ ์๋์ ๋งฅ๋ฝ์ด๋ ์๋์์ ๋ฒ์ด๋๋ ํ์ |
| Empirical | ์ค์ ์คํ์ด๋ ๊ด์ฐฐ์ ํตํด ์ป์ ๋ฐ์ดํฐ์ ๊ธฐ๋ฐํ ์ค์ฆ์ ์ธ ์ ๊ทผ |
| Federated | ์ฌ๋ฌ ๊ณณ์ ๋ถ์ฐ๋์ด ์์ง๋ง ํ๋์ฒ๋ผ ํ๋ ฅํ๋ ์ฐํฉ ๋ฐฉ์ |
- Core Runtime: Python 3.9+, GGUF (llama.cpp), Ollama
- Agent Framework: Custom hierarchical orchestration
- Data Pipeline: SQLite, pandas, Arrow
- Communication: Telegram Bot API, HTTPS, SCP
- AI/ML: Whisper, LoRA, BitNet, llama.cpp
- Containerization: Docker, Docker Compose
- UI/UX: Tkinter, Web-based dashboards
- Monitoring: Custom power/performance tracking
์ ๋ Multi-Agent Systems, Edge Computing, ๊ทธ๋ฆฌ๊ณ AI SRE ๋ถ์ผ์ ๋ํ ํ์ ์ ๋ด๋ก ์ ์ธ์ ๋ ํ์ํฉ๋๋ค.
- GitHub: @uno-km
- Email: zhfldk014745@naver.com
- Tstory : my-blog
- Research Focus: Hierarchical AI Orchestration, Edge-native Inference, Data Sovereignty
Generated with โค๏ธ by AMEVA Researcher Portfolio Builder
Last Updated: June 2, 2026

