AI & Automation

Letta (MemGPT) คืออะไร? คู่มือ AI Agent ที่มีหน่วยความจำถาวรสำหรับธุรกิจ SME ไทย ปี 2026

Letta (เดิมชื่อ MemGPT) คือเฟรมเวิร์กโอเพนซอร์สที่ให้ AI Agent มีหน่วยความจำถาวรคล้ายระบบปฏิบัติการ ทำให้ AI จดจำลูกค้าได้ข้ามวัน พร้อมคู่มือใช้งาน 2026

AF
ADS FIT Team
·8 นาที
Share:
Letta (MemGPT) คืออะไร? คู่มือ AI Agent ที่มีหน่วยความจำถาวรสำหรับธุรกิจ SME ไทย ปี 2026

# Letta (MemGPT) คืออะไร? คู่มือ AI Agent ที่มีหน่วยความจำถาวรสำหรับธุรกิจ SME ไทย ปี 2026

AI Agent ที่เราใช้อยู่ทุกวันนี้มีปัญหาสำคัญอย่างหนึ่ง คือ "ลืม" สิ่งที่คุยไปเมื่อวานนี้ทันทีเมื่อเปิด session ใหม่ ปัญหานี้เกิดจากข้อจำกัดของ Context Window ที่มีขนาดจำกัด ทำให้ AI ไม่สามารถเก็บข้อมูลของลูกค้าหรือประวัติการสนทนาระยะยาวได้จริง

Letta (เดิมชื่อ MemGPT) เป็นเฟรมเวิร์กโอเพนซอร์สที่แก้ปัญหานี้ โดยให้ AI Agent มีหน่วยความจำถาวรคล้ายกับระบบปฏิบัติการของคอมพิวเตอร์ (OS-Inspired Memory) ทำให้ AI จดจำลูกค้าได้ข้ามวัน ข้ามสัปดาห์ หรือข้ามปี โดยไม่ต้องเทรนโมเดลใหม่

ในคู่มือฉบับปี 2026 นี้ คุณจะเข้าใจว่า Letta ทำงานอย่างไร แตกต่างจาก LangChain อย่างไร และจะนำไปใช้ในระบบ Customer Support, CRM หรือ Personal Assistant ของธุรกิจ SME ไทยได้อย่างไร พร้อมโค้ดตัวอย่างที่ใช้งานได้จริง

ปัญหาของ AI Agent แบบดั้งเดิม: Context Window Limit

LLM รุ่นใหม่ๆ เช่น GPT-4.1 หรือ Claude 3.7 มี Context Window ใหญ่ถึง 200K-1M tokens แต่ในทางปฏิบัติ เมื่อใช้งานจริงจะเจอปัญหาดังนี้:

  • **ค่าใช้จ่ายสูง** การยัด context ขนาดใหญ่ทุก request ทำให้ต้นทุน API พุ่งสูงมาก บางองค์กรเสียเงินเพิ่ม 3-5 เท่าต่อเดือน
  • **Latency ช้าลง** ยิ่ง prompt ยาว ยิ่งตอบช้า กระทบประสบการณ์ผู้ใช้โดยตรง
  • **Lost in the Middle** LLM มักลืมข้อมูลตรงกลางของ prompt ที่ยาวมาก ทำให้ความแม่นยำลดลง
  • **ไม่มีการจัดลำดับความสำคัญ** ข้อมูลสำคัญและไม่สำคัญถูก treat เท่ากัน
  • Letta แก้ปัญหานี้โดยให้ AI ตัดสินใจเองว่าข้อมูลไหนควรเก็บไว้ใน "RAM" (context window) และข้อมูลไหนควรย้ายไป "Disk" (external storage) คล้ายกับการจัดการหน่วยความจำของระบบปฏิบัติการสมัยใหม่

    สถาปัตยกรรม Letta: Virtual Context Management

    Letta แบ่งหน่วยความจำของ Agent ออกเป็น 2 ระดับเหมือนระบบปฏิบัติการ:

    1. Main Context (RAM)

    ข้อมูลที่ LLM เห็นโดยตรงในทุก turn ประกอบด้วย:

  • **System Instructions** คำสั่งหลักของ Agent
  • **Working Context** บล็อกข้อมูลเกี่ยวกับผู้ใช้และ persona ของ Agent
  • **FIFO Queue** ข้อความล่าสุดในการสนทนา
  • 2. External Context (Disk)

    ข้อมูลที่ LLM เข้าถึงผ่าน "เครื่องมือ" (Tool Calls):

  • **Recall Memory** ประวัติการสนทนาทั้งหมดที่ผ่านมา
  • **Archival Memory** ฐานข้อมูลเอกสารและความรู้ระยะยาว (Vector Database)
  • เมื่อ Main Context ใกล้เต็ม Letta จะเรียก `memory_replace` หรือ `memory_insert` เพื่อย้ายข้อมูลที่สำคัญน้อยกว่าไปยัง External Context อัตโนมัติ ซึ่งเป็นแนวคิดหลักที่เปลี่ยนวิธีการสร้าง Agent ไปตลอดกาล

    Letta vs LangChain vs LlamaIndex เลือกอะไรดี?

    | คุณสมบัติ | Letta | LangChain | LlamaIndex |

    |---|---|---|---|

    | Stateful Agent | ใช่ (native) | ไม่ (ต้องเพิ่ม Memory เอง) | บางส่วน |

    | Long-term Memory | ใช่ (Built-in) | ต้อง integrate Vector DB เอง | ใช่ |

    | Self-Editing Memory | ใช่ | ไม่ | ไม่ |

    | REST API Server | ใช่ (Letta Server) | ไม่ | บางส่วน |

    | GUI จัดการ Agent | ใช่ (Letta ADE) | ไม่ | ไม่ |

    | ชุมชนผู้ใช้ | กลาง | ใหญ่มาก | ใหญ่ |

    | Learning Curve | ปานกลาง | สูง | ปานกลาง |

    สรุปการเลือกใช้: ถ้าต้องการ Agent ที่ "จำ" ลูกค้าได้จริงแบบมืออาชีพ Letta เป็นตัวเลือกที่ดีกว่า แต่ถ้าต้องการ orchestration หลายขั้นตอนที่ซับซ้อน LangChain ยังคงมีความยืดหยุ่นกว่า ทั้งสองตัวไม่ได้ขัดแย้งกัน สามารถใช้ร่วมกันได้

    How to: ติดตั้งและใช้ Letta ใน 5 ขั้นตอน

    Step 1: ติดตั้ง Letta Server ผ่าน Docker

    ```bash

    docker run -d --name letta \

    -p 8283:8283 \

    -e OPENAI_API_KEY="sk-..." \

    letta/letta:latest

    ```

    Step 2: ติดตั้ง Python SDK

    ```bash

    pip install letta-client

    ```

    Step 3: สร้าง Agent พร้อม Persona

    ```python

    from letta_client import Letta

    client = Letta(base_url="http://localhost:8283")

    agent = client.agents.create(

    name="sme_support_agent",

    memory_blocks=[

    {"label": "persona", "value": "I am a friendly support agent for ADS FIT."},

    {"label": "human", "value": "The user is a business owner in Thailand."}

    ],

    model="openai/gpt-4.1",

    embedding="openai/text-embedding-3-small"

    )

    ```

    Step 4: ส่งข้อความและให้ Agent จดจำ

    ```python

    response = client.agents.messages.create(

    agent_id=agent.id,

    messages=[{"role": "user", "content": "ผมชื่อสมชาย เปิดร้านกาแฟที่สีลม"}]

    )

    ```

    Step 5: ปิด session แล้วเปิดใหม่ Agent ยังจำได้

    ```python

    # ผ่านไป 1 สัปดาห์ ใช้ agent_id เดิม

    response = client.agents.messages.create(

    agent_id=agent.id,

    messages=[{"role": "user", "content": "ช่วยคิดโปรโมชันหน้าฝนให้หน่อย"}]

    )

    # Agent จะตอบโดยอ้างอิงข้อมูลร้านกาแฟและย่านสีลมที่เคยบอกไว้

    ```

    Use Case จริงสำหรับ SME ไทย

    1. Customer Support Bot ที่จำประวัติลูกค้าได้

    ระบบ Chat Support ทั่วไปเริ่มต้นจากศูนย์ทุกครั้งที่ลูกค้าติดต่อ ทำให้ลูกค้ารู้สึกเหมือนคุยกับคนใหม่ตลอด Letta ช่วยให้บอทจดจำปัญหาที่เคยแก้ไข สินค้าที่ลูกค้าซื้อ และ preference ของแต่ละคน ลดเวลาในการแก้ปัญหาและเพิ่ม Customer Satisfaction ได้ถึง 40%

    2. AI Sales Assistant ส่วนตัวสำหรับ Sales Rep

    Sales Rep แต่ละคนมี Agent ของตัวเองที่จดจำ Pipeline การสนทนากับลูกค้าแต่ละราย และ follow-up action items สามารถเชื่อมต่อกับ CRM เช่น HubSpot หรือ Salesforce ได้โดยตรง ทำให้ Sales ไม่ต้องจดบันทึกเองและมีผู้ช่วยที่รู้จักลูกค้าทุกคนในมือ

    3. Knowledge Worker Assistant

    นักการตลาด นักวิเคราะห์ หรือ PM ใช้ Letta Agent เป็นผู้ช่วยส่วนตัวที่จดจำ context ของโปรเจกต์ทั้งหมด ไม่ต้องอธิบายบริบทซ้ำทุกครั้งที่เริ่ม chat ใหม่ ช่วยประหยัดเวลาได้มาก

    ความท้าทายและข้อควรระวัง

  • **ต้นทุน Infrastructure** ต้องมี PostgreSQL + pgvector หรือ Qdrant สำหรับเก็บ Archival Memory
  • **Privacy และ PDPA** ข้อมูลลูกค้าที่ Agent จดจำต้องจัดเก็บตามกฎหมาย PDPA โดยเฉพาะข้อมูลอ่อนไหว เช่น ข้อมูลสุขภาพหรือการเงิน
  • **Hallucination ในการเรียก Memory** บางครั้ง LLM อาจเรียก memory ที่ไม่เกี่ยวข้อง ต้องมี Evaluation loop
  • Best Practices

  • เริ่มจาก Agent เดียวก่อน ทดสอบให้มั่นใจก่อน scale ไปหลาย Agent
  • กำหนด Memory Block ให้ชัดเจน เช่น persona, user, organization, project
  • ใช้ Letta ADE (Agent Development Environment) ในการ debug และดูหน่วยความจำของ Agent แบบ real-time
  • สรุปและขั้นตอนต่อไป

    Letta (MemGPT) เปิดประตูสู่ยุคใหม่ของ AI Agent ที่ "ไม่ลืม" ลูกค้า ทำให้ธุรกิจ SME ไทยสามารถสร้างประสบการณ์ AI ที่เป็นส่วนตัวและมีความต่อเนื่องได้โดยไม่ต้องลงทุนในโมเดลเฉพาะทาง

    Key Takeaways

  • Letta ให้ Agent มี Stateful Memory คล้าย OS ของคอมพิวเตอร์
  • เหมาะสำหรับ Support Bot, Sales Assistant และ Knowledge Worker
  • Integrate ง่ายผ่าน REST API และ Python SDK
  • ต้องวางแผนด้าน PDPA และต้นทุน Infrastructure ตั้งแต่ต้น
  • หากต้องการคำปรึกษาในการออกแบบระบบ AI Agent ที่มีหน่วยความจำถาวรสำหรับองค์กร ADS FIT ยินดีให้คำแนะนำ [ติดต่อทีมงาน](https://www.adsfit.co.th/contact) หรืออ่านบทความอื่นๆ เกี่ยวกับ AI Agents และ LLM ได้ที่บล็อกของเรา

    Tags

    #Letta#MemGPT#AI Agent#Long-term Memory#LLM#Stateful AI

    สนใจโซลูชันนี้?

    ปรึกษาทีม ADS FIT ฟรี เราพร้อมออกแบบระบบที่ฟิตกับธุรกิจของคุณ

    ติดต่อเรา →

    บทความที่เกี่ยวข้อง