90% מהספאם מאחורי – Project Honey Pot

נדב

לפני שבוע בערך התקנתי את http:BL – תוסף לוורדפרס שמסנן ספאם. התוסף בנוי על בסיס Project Honey Pot‏:"(גילוי נאות – הלינק הזה מציין שאני הפניתי אותכם. לא הבנתי מה אני מרוויח מהעניין, אבל זה כנראה רק קארמה טובה.)":.

הרעיון בפרוייקט כד הדבש הוא זיהוי של ספאמרים בשלב הטרום-ספאם – התוסף מנסה לגלות את הספיידרים שאוספים מהרשת את כתובות הדוא"ל לרשימות, שמשמשות אחר כך לשליחת דואר זבל. בנוסף, הוא מזהה גם בוטים שמשגרים ספאם בתגובות.

הדרך שבה הוא עושה את זה היא פשוט גאונית לטעמי – בכל אתר המשתתף בתוכנית קיים דף מיוחד, שהוא מלכודת כד הדבש. לדף הזה אמורים להפנות רק קישורים שגלויים רק לבוטים ולא לבני אנוש. הדף מכיל בעיקר הזהרה משפטית, אבל גם כתובת דואר אלקטרוני או טופס HTML.
כתובת הדוא"ל הזו היא לשימוש חד פעמי – בכל פעם שהדף מוצג, מוצגת כתובת דוא"ל שונה. אם כתובת הדואר הזו מקבלת ספאם, אפשר לדעת בוודאות מי שלח אותו, וכך לסמן את האיי-פי שלו כספאמר. תהליך דומה מופעל גם על בוטים של ספאם תגובות.

לא כל כך ברור לי מה עושים עם המידע הזה – הם טוענים שהם מספקים ראיות משפטיות לרשויות אכיפת החוק, זה נראה לי קצת מופרך. אבל אחד היישומים האפשריים נקרא httpBL – רשימה שחורה של כתובות IP של ספיידרים וספאמרים.

כאן נכנס לסיפור התוסף httpBL – בכל גישה לבלוג הוא בודק את האיי-פי מול המאגרים של הפרוייקט, ובמידה ומדובר בספאמר ידוע הוא מפנה אותו למלכודת הדבש, במקום לבלוג עצמו. בכך יש שני יתרונות: קודם כל, מנענו מהספאמר גישה לבלוג שלנו, והוא לא יאסוף אצלנו כתובות דואר ולא יזהם את הבלוג. שנית, עצרנו את הספיידר – ספיידרים מתקדמים באינטרנט מקישור לקישור. ברגע שאנחנו מפנים את הספיידר למבוי סתום, הוא לא יכול להמשיך מהבלוג שלנו למקומות אחרים והיעילות שלו נפגמת.

הפעלתי את התוסף לפני שבוע, והתוצאות מרשימות. מאז הפעלתי את הבלוג העצמאי הזה, אקזימט חסם 13,250 תגובות זבל – כ-40 תגובות זבל ליום, או 280 לשבוע. בשבוע שבו הפעלתי את התוסף קיבלתי 29 תגובות זבל (מתוכן 20 מאותו איי פי!) – ללא ספק שיפור מדהים. אמנם אני עדיין צריך תוסף אנטי-ספאם נוסף לסינון תגובות – במקרה שלי אקזימט – אבל עם כזה מספר של תגובות זבל הוא דורש בערך כניסה אחת לשבוע לסינון תגובות לגיטימיות. כשאין מערכת נוספת לסינון – כמו בבלוגדיבייט למשל – זה ההבדל בין הצפת ספאם לבין הטרדות ספוראדיות.

7 תגובות »

נדב ב20/01/2008 20:27 תחת וורדפרס, טכניים

7 Responses to “90% מהספאם מאחורי – Project Honey Pot”

  1. דובי הגיב:

    באייל יש (או היה) מנגנון דומה. הקישור הראשון שמופיע עבור בוטים מוביל למלכודת דבש (פלוס הוראה לבוטים שמכבדים את robots.txt לא להכנס לשם. בעמוד של מלכודת הדבש יש רשימה מיוצרת על-ידי מכונה של כתובות דוא"ל מפוברקות בדומיינים של ספאמרים ידועים (על בסיס רשימות שחורות כלשהן), כשבסוף העמוד יש קישור לעוד עמוד – שמכיל עוד כתובות כאלו.

    יתרונות:
    1. זה מעסיק את הבוט עם אינסוף עמודים חסרי ערך במקום להמשיך לשאר האתר (כשבוט מגיע למבוי סתום הוא פשוט חוזר אחורה וממשיך לעבור על האתר מהעמוד האחרון עם קישורים שהוא לא נכנס אליהם. חסרון: צורך משאבים מהשרת).
    2. זה גורם לכמות גדולה של ספאם שנשלח דווקא אל הספאמרים עצמם במקום אל אנשים תמימים (חסרון: זה מגדיל את תעבורת הספאם הכללית באינטרנט, אבל אפשר להניח שזה שולי).

    נשמע לי הרבה יותר כיף.

  2. ולנסיה הגיב:

    יש קצת בעיה עם זיהוי ספאמרים על פי IP. במקרים של חיבור מאחורי NAT או פרוקסי משותף, ספאמר עיקש אחד יכול לחסום הרבה מאוד אנשים.
    אני לא יודעת אם זה תקף למלכודת הדבש הזו, אבל סינון IP לשליחת דוא"ל כבר עשה לא מעט צרות.

  3. […] נדב הגעתי לתוסף http:BL שמבצע סינון של תגובות על בסיס של […]

  4. […] נדב הגעתי לתוסף http:BL שמבצע סינון של תגובות על בסיס של […]

  5. […] נדב הגעתי לתוסף http:BL שמבצע סינון של תגובות על בסיס של […]

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

877591 דפים נצפים, 25 היום
309014 ביקורים, 17 היום
FireStats icon ‏מריץ FireStats‏