קלוד אייג'נט 2.0: איך לבנות סוכן AI אישי שמחליף את Hermes ועובד 24/7
The Pulse:
- Hermes צבר 124,000 כוכבים ב-GitHub והפך לסוכן ה-AI הנפוץ ביותר כרגעו, אך כל עדכון מסגרת מחייב חיבור מחדש של כל 15 השירותים המחוברים אליו.
- מערכת הזיכרון של Gravity Claw פועלת בשלוש שכבות: ליבה סמנטית (soul.md), חוצץ של 100 הודעות אחרונות, ואינדקס וקטורי ב-Pinecone, כאשר כל שם skill נטען ב-30 טוקנים בלבד לתוך ה-system prompt.
- שימוש ב-Firecrawl למחקר זול בכ-80% ממחקר AI רגיל, ו-GPT-5.5 נגיש דרך OAuth עם מנוי ChatGPT של 20 דולר לחודש ללא עלות נוספת, בעוד Claude אינו מאפשר אימות מסוג זה.
TL;DR: Hermes הוא סוכן ה-AI החזק ביותר כרגע עם 124,000 כוכבים ב-GitHub, אך התלות שלו במסגרת קוד אחת יוצרת צוואר בקבוק שמאלץ חיבור מחדש של כל השירותים בכל עדכון. הגישה החלופית שפיתח Jack Roberts היא cherry-picking: בחירת הרכיבים הטובים ביותר מכל מסגרת ושילובם בסוכן מותאם אישית שרץ ב-Railway עם מערכת זיכרון סמנטית ב-Pinecone ויכולות מחקר דרך Firecrawl.
הפער בין מסגרות AI מוכנות מראש לבין סוכן מותאם אישית הוא בדיוק הפער שבין לוח הזמנים של מישהו אחר לבין לוח הזמנים שלך. כל פעם שמסגרת חדשה משתלטת על GitHub, המשתמשים נאלצים לנטוש את הזיכרון שנצבר, לחבר מחדש עשרות שירותים, ולהתחיל מאפס. Jack Roberts, יזם שבנה ומכר סטארטאפ עם 60,000 לקוחות, פיתח גישה שונה לחלוטין.
במקום לרדוף אחרי כל מסגרת חדשה, הגישה המוצגת כאן בונה שכבת בסיס יציבה ומייבאת ממנה רק את הרכיבים שעובדים. התוצאה היא סוכן AI אישי שרץ 24/7, זוכר את כל ההיסטוריה, מפתח כלים חדשים בעצמו, ואינו תלוי בשום מפתח חיצוני שיחליט מתי לשחרר גרסה הבאה.
למה Hermes עם 124,000 כוכבים ב-GitHub עדיין לא מספיק
Hermes הוא בעצם סוכן ה-AI החזק ביותר בשוק כרגע: מערכת זיכרון ארבע-שכבתית, לולאת רקע שמחלימה בזמן שאתה ישן, יכולת כתיבת כלים עצמאית. אבל כל עדכון מסגרת חדש (framework) כופה עליך חיבור מחדש של כל השירותים. Telegram, Discord, ועוד 13 שירותים נוספים. זה כמו לבנות בית על קרקע זרה: הבניין יפה, אבל אתה תלוי בבעליה.
Jack Roberts, יזם טכנולוגיה שבנה ומכר סטארטאפ עם 60,000 לקוחות, הסביר לי את הבעיה הזו בפרטיות. Hermes עם 124,000 כוכבים ב-GitHub הוא באמת מרשים. הוא חולם בזמן שאתה ישן: לולאה רקע המחשבת על כל שיחה, מנקה סתירות, ומעבדת הכל לתוך memory.md. אחרי 5 קריאות כלים או יותר על משימה מורכבת, הסוכן כותב skill.md אוטומטית: הוא למד משהו חדש וזה נשמר לעבודה הבאה. זה דומה לעובד שמשתפר כל יום.
המערכת הזיכרון של Hermes היא בעצם ארכיטקטורה ארבע-שכבתית: memory.md (הזיכרון ארוך טווח), user.md (מי אתה), skill.md (מה הוא למד), ו-SQLite בתוספת אחסון episodic pluggable. זה אומר שהסוכן זוכר אותך באמת: לא רק בתוך שיחה אחת, אלא על פני חודשים. וגם: שער אחד ל-15 שירותים. Telegram, Discord, Slack, Gmail, ועוד. משהו קטן מדי? הסוכן מדבר אליו דרך ממשק אחד.
| הגישה המסורתית (Hermes כפי שהוא) | הגישה שלי (Gravity Claw) |
|---|---|
| כל עדכון מסגרת חדש = חיבור מחדש של כל 15 השירותים | cherry-picking: תוך שניות, תוסף את הפיצ'רים שאתה רוצה לסוכן קיים |
| תלות מלאה בלוח הזמנים של Hermes (או Open Code, או NL) | אתה בעל הדרך: מודל כלשהו (GPT-5.5, Claude, DeepSeek), זיכרון שלך, כלים שלך |
| אתה מאבד את כל הזיכרונות כשאתה עובר למסגרת חדשה | זיכרון תלת-שכבתי (soul.md + buffer + Pinecone) נשאר שלך תמיד |
| קשה לדבג או לשנות משהו ללא הבנה עמוקה של הקוד | Anti-Gravity/Claude Code: פשוט תגיד למה אתה צריך, הוא בונה |
| אתה תלוי בדרך שלהם של לעשות דברים | אתה בונה בדיוק את מה שאתה צריך: dashboard משלך, skills משלך, זרימה משלך |
אבל הבעיה האמיתית? כל פעם שמסגרת חדשה יוצאת לשוק. Hermes, Open Code, NL, או כל דבר בעתיד: אתה צריך לעשות הכל מחדש. זה לא רק משימה טכנית; זה אובדן הקשר. הסוכן לא יודע מי אתה כי כל הזיכרונות הישנים נשארו במערכת הישנה. וגם אם אתה מעתיק אותם ידנית, זה מכאני וקל לטעויות. Jack Roberts אמר לי שהוא נתקל בקיר בדיוק בנקודה הזו: הוא רצה לשדרג את הסוכן שלו, אבל החשבון של "לא אוכל להוציא את כל הזיכרונות בצורה נקייה" גרם לו להישאר תקוע בגרסה ישנה. זה כמו להיות קשור לעבר שלא אתה בחרת.
יש עוד בעיה: אתה לא באמת מבין מה קורה תחת הקפוד. Hermes היא מסגרת מורכבת. אם משהו לא עובד כמו שצריך, או אם אתה רוצה להוסיף משהו ייחודי שלא בנוי בתוכה, אתה תקוע. אתה צריך או לחכות לתיקון מהמתחזקים או ללמוד את כל הקוד שלה: וזה לא קל. גם אם הם חברים טובים וחכמים, זה עדיין הדרך שלהם, לא שלך. אתה תמיד תרגיש את ההגבלה כשאתה מנסה לעשות משהו שונה מהנתיב המוגדר מראש.
התובנה המרכזית: Hermes עם 124,000 כוכבים היא הוכחה שהרעיון עובד: אבל התלות במסגרת בודדת יוצרת צוואר בקבוק שמונע מך להתאים את הסוכן לחיים שלך, לא להתאים את חייך לסוכן.
גישת Cherry-Picking: שילוב הרכיבים הטובים מכל מסגרת בסוכן אחד
התשובה הישירה: במקום להיות תלוי במסגרת אחת, אתה מעתיק את ה-GitHub repo של Hermes לסביבת קוד (Anti-Gravity או Claude Code), מבקש מה-AI לזהות את הפיצ'רים הייחודיים, ואז בוחר ידנית רק את הרכיבים שאתה צריך: כמו self-generating skills, procedural memory, sub-agent delegation ו-context files: ומשלבים אותם בסוכן Claude המותאם שלך בפרומפט אחד בלבד.
הבעיה עם Hermes וכל מסגרת AI מוכנה מראש היא שהיא משעבדת אותך לרודמאפ של מישהו אחר. כל פעם שמסגרת חדשה יוצאת לשוק: בין אם זה Open Code, NL, או משהו שעדיין לא קיים: אתה חייב לבחור: או להישאר עם הישן, או להתחיל מחדש בחיבור מחדש של כל 15 השירותים שלך (Telegram, Discord וכו'). אתה מאבד את כל הזיכרונות שנצברו, את כל ההתאמות, את כל ההקשר. זה כמו להתחיל מאפס בכל פעם. הגישה של cherry-picking פותרת את זה בשלב אחד: אתה בונה סוכן אחד שלך, וכל פעם שמשהו חדש יוצא, אתה פשוט מוציא את הפיצ'רים הטובים ממנו ומוסיף אותם לשלך.
התהליך המעשי פשוט: פתח את ה-Anti-Gravity או Claude Code, דבק את ה-GitHub repo של Hermes, וגם לה-AI "עבור דרך ה-repo, זהה את כל הפיצ'רים הייחודיים שלנו אין, ותן לי רשימה בקטגוריות: easy wins, medium effort, big lift." בדקה אחת תקבל ניתוח מלא של מה שכדאי לך. מה שנמצא שכדאי ביותר מ-Hermes? ארבעה דברים עיקריים: self-generating skills (הסוכן כותב לעצמו כלים חדשים אחרי משימות מורכבות), procedural memory (זיכרון שמנטע סתירות ודוקק הכל לשכבות), sub-agent delegation (יכולת לשלוח משימות לתת-סוכנים), ו-context files (קבצים שמספקים הקשר ממושך). כל אלה עברו בקטגוריית "easy wins": כלומר, הוספה בפרומפט אחד בלבד ללא שינויים בארכיטקטורה.
כשהתחלתי להוסיף את self-generating skills, זה לקח בדיוק פרומפט אחד. "הוסף self-generating skills. תן לי לדעת אם אתה צריך משהו ממני. אשר כשזה מוכן." תוך דקות, זה היה בחיים. הסוכן עכשיו כותב לעצמו skills חדשים אחרי חמש קריאות כלים על משימה מורכבת: בדיוק כמו Hermes: אבל זה חלק מהמערכת שלך, לא תלוי בו. אתה יכול להוסיף עוד פיצ'רים מ-Open Code, מ-DeepSeek, מ-Anthropic: מה שתרצה: ללא חשש שהעדכון הבא של Hermes ישבור הכל.
מה זה אומר בפועל: בעזרת cherry-picking אתה משלבת את היתרונות של Hermes (skills, זיכרון רב-שכבתי, delegation) עם השליטה המלאה שלך על הארכיטקטורה: וזה לא מחייב שום תלות במסגרת חיצונית או עדכון מחדש של כל השירותים בכל פעם שמשהו חדש מגיע לשוק.
מערכת הזיכרון התלת-שכבתית ו-Firecrawl: הלב של Gravity Claw
מערכת הזיכרון היעילה של סוכן AI מתבססת על שלוש שכבות נפרדות: ליבה קבועה (soul.md), חוצץ שיחתי מתגלגל (100 הודעות אחרונות), ואינדקס סמנטי ב-Pinecone שמאנדקס את כל התוכן. בשילוב עם Firecrawl לגרידת אתרים ב-80% פחות עלות ממחקר AI רגיל, ופריסה ב-Railway שעובדת 24/7 ללא חשיפה לאינטרנט, אתה מקבל מערכת זיכרון שמתאימה לכל סוכן AI וקלה לתחזוקה.
השכבה הראשונה, שאני קורא לה soul.md, היא הליבה של הסוכן. היא מכילה את הפרטים הבסיסיים שהסוכן צריך לדעת עליך: השם שלך, ההעדפות שלך, המידע הקריטי שמגדיר את אישיותו וסגנון התקשורת שלו. זו לא מערכת זיכרון גדולה – היא קטנה, מדויקת ותמיד זמינה. השכבה השנייה היא חוצץ שיחתי (conversational buffer), שמחזיק את 100 ההודעות האחרונות של השיחה שלך עם הסוכן. זה מאפשר להסוכן להבין את ההקשר הקרוב, לזכור את מה שאמרת לפני דקה או שעה, ולהגיב בצורה טבעית בלי שתצטרך לחזור על עצמך. השכבה השלישית, זו הסמנטית, היא המנוע האמיתי: היא מאנדקסת הכל ב-Pinecone, שהיא מסד נתונים וקטורי (vector database) שמבין משמעות, לא רק מילים. כשאתה משאל את הסוכן משהו, הוא לא מחפש התאמה מדויקת של טקסט – הוא מחפש רעיונות דומים מבחינה סמנטית מכל מה שהוא למד עליך.
עכשיו, איפה הסוכן בעצם מחפש מידע חדש? כאן נכנס Firecrawl. במקום להשתמש ב-API רגיל של מחקר AI, שעולה הרבה כסף, Firecrawl הוא כלי גרידה אתרים חכם שעולה בערך 80% פחות מאלטרנטיבות רגילות. כשאתה אומר לסוכן "חפש לי מידע על X", הוא משתמש ב-Firecrawl כדי להיכנס לאתרים, לחלץ את התוכן הרלוונטי, ולהחזיר לך סיכום קוהרנטי. זה לא "vibes" או ניחוש – זה מחקר אמיתי מהאתרים עצמם. כדי להשתמש בזה, אתה פשוט מוסיף את ה-API key של Firecrawl לתוך המשתנים הסביבתיים שלך (environment variables) ב-Anti-Gravity או Claude Code, וכל פעם שהסוכן צריך לחפש משהו, הוא יכול להשתמש בזה באופן אוטומטי.
כל זה חי איפה? ב-Railway. Platform זה נבחר בעיקר משום שהוא לא חשוף לאינטרנט – המשמעות היא שהסוכן שלך רץ בצורה מאובטחת, ובעיקר, הוא עובד גם כשהמחשב שלך סגור. לא צריך להשאיר את המחשב דלוק 24/7, לא צריך לדאוג שהשירת את הפורט בטעות, לא צריך לקום בלילה עם חרדה שמישהו פרץ לשם. Railway מטפל בכל זה, ויחידה זו של Gravity Claw עובדת כל הזמן, גם כשאתה ישן. כשאתה רוצה להוסיף פיצ'ר חדש או לתקן משהו, אתה פשוט מתחבר ל-Anti-Gravity או Claude Code, אומר לו מה אתה רוצה, והוא עדכן את הקוד ב-Railway בשניות. זה כל כך פשוט שזה כמעט בלתי אמין.
יש עוד חלק חשוב: כל skill (כישרון) שהסוכן שלך יודע לעשות מאוחסן כקובץ Markdown פשוט. כל שם skill נטען ל-system prompt שלך בלבד 30 טוקנים – זה כמעט כלום מבחינת עלות ה-API. המשמעות היא שאתה יכול להיות בעל מאות skills, והסוכן יבחר בחכמה אילו להשתמש בהם בלי שזה יעלה לך הרבה כסף. בהשוואה ל-Hermes או מסגרות אחרות שמטעינות את כל הפיצ'רים לתוך ה-context, זה יעיל בהרבה.
אם אתה חושב על מודל: אתה יכול להשתמש ב-GPT-5.5 דרך מנוי ChatGPT של $20 לחודש ללא עלות נוספת – זה זמין דרך OAuth, שהוא סוג של הרשאה בטוחה. Claude לא מאפשר זאת, אז אם אתה רוצה את המודל החזק ביותר בעלות נמוכה, GPT-5.5 היא הדרך. אם אתה רוצה משהו זול יותר, DeepSeek הוא "hidden powerhouse" שעולה בהרבה פחות, אבל צריך להיות זהיר עם מה שאתה מקלידה שם (יש חששות פרטיות עם חברות סיניות). בכל מקרה, המערכת תומכת בכל מודל – אתה יכול להחליף אותו בשניה אם תרצה.
התובנה המרכזית: מערכת זיכרון תלת-שכבתית עם Pinecone ו-Firecrawl משלבת יכולת מחקר אמיתית בעלות נמוכה עם זיכרון סמנטי שמבין הקשר, מה שהופך סוכן AI מתוך מכונת צ'אט לשותף עסקי שמחפש מידע בפעם הראשונה.
בחירת מודל ופריסה: GPT-5.5, Claude, DeepSeek ו-Railway מול VPS
הבחירה בין מודל ה-AI והפלטפורמה שבה הוא רץ קובעת את מהירות התגובה, העלות החודשית, וקל האבטחה של הסוכן שלך. GPT-5.5 זמין דרך מנוי ChatGPT של $20 לחודש עם גישה דרך OAuth ללא עלות נוספת, Claude אינו מאפשר זאת, DeepSeek מתואר כ-hidden powerhouse עם עלות נמוכה במיוחד, ו-Railway מציע פריסה לא חשופה לאינטרנט שרצה גם כשהמחשב סגור.
בעבודתי עם סוכנים מותאמים אישיים, גיליתי שהשיקול הראשון הוא הגמישות של ה-API. GPT-5.5 מספק אחד מהיתרונות הגדולים ביותר: אתה כבר משלם עבור מנוי ChatGPT, והגישה ל-GPT-5.5 דרך OAuth פירושה שאין עלות נוספת לכל קריאה API שהסוכן שלך עושה. זה שונה מעקרון אחרים שבהם אתה משלם לפי שימוש. Claude, למרות היותו מעולה, אינו מאפשר OAuth ישיר לחשבון אישי, מה שאומר שאתה צריך API key ובחיוב נפרד. DeepSeek מציע משהו שונה לגמרי: עלות חישוב נמוכה משמעותית, אך כפי שציינתי בסרטון נפרד, יש להיות זהיר יותר עם מה שאתה משדר אליו מבחינת פרטיות נתונים. הבחירה בין שלוש האפשרויות הללו תלויה בעדיפויות שלך: עלות מינימלית עם OAuth (GPT-5.5), איכות חישוב גבוהה עם בחיוב API (Claude), או עלות קיצונית נמוכה עם שיקולי אבטחה (DeepSeek).
כשמדובר בפריסה, יש לך שלוש אפשרויות עיקריות: VPS (Virtual Private Server), Mac Mini או מחשב שולחני, ו-Railway. VPS דורש הגדרה מאובטחת, וקיימת לי מדריך מלא לאופן ביצוע זה בצורה נכונה, אך זה מחייב הבנה של יציאות (ports), הרשאות, והחשיפה לאינטרנט. Mac Mini או מחשב שולחני פירושו שהסוכן רץ רק כאשר המכונה פועלת, וזה יוצר בעיות אם אתה רוצה שהוא יעבוד 24/7 בעוד אתה בחוץ או כשהמחשב שלך סגור. Railway, שבו אני משתמש אישית ב-Gravity Claw שלי, פותר את שתי הבעיות הללו: זה לא חשוף לאינטרנט (אבטחה טובה יותר), וזה רץ כל הזמן ללא תלות במצב המחשב שלך. החיבור ל-Railway מ-Anti-Gravity או Claude Code הוא פשוט להפליא: אתה פשוט מחבר את המאגר שלך, ו-Railway מטפל בכל השאר. אין צורך בלילות ללא שינה בדאגה אם השארת יציאה חשופה או אם משהו השתבש.
בנוגע לתהליך הפריסה עצמו, כל מה שצריך לעשות הוא להוסיף את ה-API keys שלך (Firecrawl, ChatGPT, או כל שירות אחר) למשתנים הסביבתיים שלך ב-Anti-Gravity או Claude Code, ואז Railway מאחסן אותם בצורה מאובטחת. זה פירושו שהמפתח שלך לעולם לא נחשף בקוד, וכל סוכן שרץ על Railway יכול לגשת אליו בבטחה. כאשר אתה משנה את הקוד או מוסיף כלים חדשים, Railway מגדיל את הפריסה באופן אוטומטי. עבור רוב המשתמשים, זו הדרך הטובה ביותר: אבטחה, פשטות, והיכולת להשאיר את הסוכן שלך רץ בזמן שאתה עושה משהו אחר.
מה זה אומר בפועל: בחירה ב-GPT-5.5 עם Railway משמעה שאתה משלם $20 לחודש ללא עלויות נוספות בעבור קריאות API, פלוס עלויות Railway זעירות (בדרך כלל פחות מ-$10 לחודש לסוכן אישי), כל זאת בזמן שהסוכן שלך רץ 24/7 בטוח ללא ניהול יציאות או חשיפה לאינטרנט.
שאלות נפוצות
האם אפשר להשתמש ב-Gravity Claw בחינם ואיפה מורידים את המערכת?
כן. Jack Roberts פרסם את המערכת המלאה בחינם – כולל הגדרת בוט Telegram, מפתחות LLM, bootstrap של משתני הסביבה ותיעוד מלא של מערכת הזיכרון. הקישור זמין ישירות מהמאגר שלו. בנוסף, ניתן להריץ את הסוכן בחינם לחלוטין דרך Open Code, ללא עלות מודל כלל – מה שהופך את נקודת הכניסה לאפסית עבור מי שרוצה לבדוק את הארכיטקטורה לפני שמחליט על מודל בתשלום.
מה ההבדל המעשי בין Hermes ל-Open Code (NL) ולמה הם נחשבים מתחרים?
Hermes ו-Open Code (המכונה גם NL) הם שתי מסגרות נפרדות עם ארכיטקטורות שונות, אך שתיהן מכוונות לאותה מטרה: סוכן AI אישי שרץ ברקע. ההבדל המעשי הוא בגישה לזיכרון ולניהול כלים. Hermes מציע מערכת ארבע-שכבתית מובנית יותר עם לולאת רקע אוטומטית, בעוד Open Code נוטה להיות גמיש יותר בהגדרה. הבעיה שמציין Jack Roberts היא שכל "ניצחון" של מסגרת אחת על השנייה מחייב חיבור מחדש של כל השירותים – תהליך שמתואר כ"מתיש". גישת cherry-picking שמוצגת כאן מנטרלת את הדיון הזה לחלוטין.
כיצד מוסיפים API key של Firecrawl לסביבת Railway בצורה מאובטחת?
התהליך פשוט יחסית: מוסיפים את מפתח ה-API של Firecrawl כמשתנה סביבה (environment variable) בלוח הבקרה של Railway – לא בקוד עצמו. לאחר מכן, בסביבת Anti-Gravity או Claude Code, אומרים לסוכן לשמור את המפתח והוא מאחסן אותו אוטומטית. היתרון האבטחתי של Railway הוא שהסביבה אינה חשופה לאינטרנט באופן ישיר, מה שמפחית את סיכון דליפת מפתחות. לעומת VPS שדורש הגדרת firewall ידנית, Railway מספק שכבת בידוד מובנית שמתאימה לרוב צרכי העסק הקטן-בינוני.
האם מערכת הזיכרון עובדת גם כשמחליפים מודל AI?
זו אחת הנקודות החזקות של הארכיטקטורה. מכיוון שהזיכרון מאוחסן בקבצי Markdown רגילים (soul.md, skill.md) ובאינדקס סמנטי ב-Pinecone – ולא בתוך המודל עצמו – ניתן להחליף בין GPT-5.5, Claude, DeepSeek וכל מודל עתידי מבלי לאבד שום מידע. ה-context window של כל שיחה נטען מחדש עם שמות ה-skills בלבד (30 טוקנים לכל skill), כך שהמעבר בין מודלים הוא שינוי שורת הגדרה אחת בלבד. זהו היתרון המבני המרכזי על פני מסגרות שמקשרות את הזיכרון ישירות לספק המודל.
כמה זמן לוקח לסוכן לכתוב skill חדש אוטומטית ומתי הוא מחליט לדלג?
הטריגר הוא 5 קריאות כלים או יותר על משימה מורכבת אחת. בנקודה זו הסוכן מקבל פרומפט רקע שואל אם התהליך שווה שמירה. ההחלטה היא אוטומטית: אם המשימה חד-פעמית, הסוכן מדלג ולא שומר. אם היא ניתנת לשימוש חוזר, הוא כותב את ה-skill ומוסיף אותו לספריה. Skills קיימים יכולים גם להתעדכן אוטומטית כשהסוכן מוצא גישה יעילה יותר, או כשהמשתמש מתקן את הזרימה ידנית. בפועל, Jack Roberts הדגים שהוספת self-generating skills הושלמה בפרומפט בודד אחד.
רוצה לדעת איפה האתר שלך עומד?
עסקים שמשתמשים ב-AEO מקבלים פי 3 יותר המלצות ממנועי AI כמו ChatGPT ו-Perplexity. אנחנו מבצעים ניתוח SEO מקצועי בחינם.
פנה אלינו בוואטסאפ עכשיו וקבל תמונת מצב מלאה של הנוכחות הדיגיטלית שלך.
אם אתם רוצים להתייעץ על יישום אסטרטגיית הפרסום החדשה הזו, אתם מוזמנים ליצור איתנו קשר כאן



