פרויקט Lumen מתעד ומנגיש בקשות משפטיות להסרת תוכן ברשת, אשר נשלחות לספקי שירותים אינטרנטיים כמו רשתות חברתיות, מנועי חיפוש ופלטפורמות תוכן מקוונות אחרות, במטרה ליידע את הציבור על הסרת תכנים, לאפשר מחקר בתחום ולהגביר את השקיפות לגבי מי שולח בקשות להסרה ומדוע. מאגר המידע שהוקם במסגרת הפרויקט מכיל מיליוני בקשות להסרת תכנים, ובכך הוא מספק שקיפות ביחס להיקף הבקשות וזהות המבקשים. מאגר המידע גדל בכ-40,000 בקשות בכל שבוע, ומועברות אליו באופן וולונטרי בקשות מגוגל, X (טוויטר), יוטיוב, ויקיפדיה, קלאודפלר ועוד. נכון לשנת 2024, המאגר מכיל מעל 18 מיליון הודעות המתייחסות למעל 4 מיליארד כתובות URL. המאגר מכיל בקשות מפלטפורמות מקוונות מרכזיות כמו WordPress, Reddit, Wikipedia, Google, X (Twitter), Github, Vimeo ועוד (מקור: Harvard Law Bulletin).
למאגר לומן חשיבות רבה עבור קהלים מקצועיים שונים: עבור חוקרים ואקדמאים, הנתונים מאפשרים לחקור מגמות בהסרת תכנים מקוונים, ניתוח יעילות והשפעת חוקי זכויות יוצרים ותובנות על חופש הרשת וצנזורה במרחב המקוון. עבור עיתונאים, המאגר מהווה מקור לחקירת ניסיונות צנזורה ושימוש לרעה בזכויות יוצרים, ומספק נתונים על אופן השימוש במנגנונים משפטיים לשליטה במידע מקוון. עבור קובעי מדיניות, המאגר מציע תובנות מבוססות ראיות לצורך עיצוב מדיניות אינטרנט וזכויות יוצרים, והבנה של ההשפעות המעשיות של חוקים קיימים על תכנים מקוונים. עבור אנשי משפט, המאגר מספק מחקרי מקרה ותקדימים הקשורים להסרת תכנים מקוונים, ומגמות באכיפת זכויות יוצרים ואתגרים משפטיים אחרים.
מטרתו המקורית של המאגר הייתה לספק מידע לגבי שימוש לרעה במנגנוני ההסרה של הפלטפורמות אשר מתבטא בשימוש במנגנונים הללו בהיקף מוגזם. אולם, המאגר מאפשר לזהות גם סוגים אחרים של שימוש לרעה. לדוגמה, לאורך השנים חוקרים חשפו דפוסי פעילות של עבריינים שמנצלים את מנגנוני ההסרה על-ידי זיוף צווים משפטיים ומסמכים אחרים. בנוסף, נחשפו ניסיונות של רוסיה לניצול מנגנוני ההסרה להסרת תכנים של עיתונאית אוקראינית, בטענה שהיא מפרה זכויות יוצרים (מקור: Harvard Law Bulletin).
סוגי הנתונים במאגר
מאגר המידע של לומן מכיל מגוון רחב של הודעות משפטיות ובקשות להסרת תכנים מקוונים מטעם גורמים מדינתיים ופרטיים במגוון תחומים:
תוכן מפר קניין רוחני: בקשות בנושאי זכויות יוצרים, זיופים, סודות מסחריים וסימני מסחר המוגשות בדרך כלל על ידי בעלי הזכויות יוצרים או נציגיהם המבקשים משירותים דיגיטליים כמו גוגל, יוטיוב או הרשתות החברתיות להסיר תוכן מסוים. לדוגמה, פניה להסרת תוכן שמפר זכויות יוצרים של טקסט, מבנה ואתר של חברה ישראלית:
פגיעה בזכויות ע״י משתמשים אחרים בפלטפורמה: לשון הרע ופגיעה בפרטיות: הודעות אלה מוגשות על ידי אנשים או גופים הטוענים כי תוכן מסוים מפר זכויות מוגנות שלהם, כגון פגיעה בפרטיות או פגיעה בשמם הטוב. הבקשות כוללות בקשות לחשיפת פרטי גולשים אנונימיים שפגעו בהם ברשת. לדוגמה, פניה של עובדת סוציאלית להסרת תכנים משמיצים כנגדה:
צווים משפטיים ובקשות מרשויות אכיפה מדינתיות: הודעות המוגשות על ידי בתי משפט או רשויות חוק, המורות על הסרת תכנים מסוימים בהתאם לחוקי המדינה. צווים אלו כוללים לעיתים קרובות תכנים הקשורים לפשעים או לפעילות בלתי חוקית אחרת.
בקשות להסרת תכנים בהתאם לחוקים מקומיים במדינות שונות: בקשות אלו יכולות לכלול תכנים המפרים את חוקי המדינה, כמו חוקים נגד שנאה או פורנוגרפיה.
היקף וסוג המידע על ישראל
האתר מאפשר להתמקד בבקשות והליכים הנוגעים לתחום השיפוט של ישראל, שהוגשו על ידי רשויות ממשלתיות או גורמים פרטיים.
בכלל זה, המאגר מספק פרטים על בקשות מחלקת הסייבר בפרקליטות המדינה להסרה או חסימה של תכנים פליליים, שפורסמו על-ידי הפלטפורמות או מנועי החיפוש שאליהן הופנו הצווים. למשל, בקשת מדינת ישראל אל Google להסרת האפשרות לחיפוש אתר ישראלי שפרסם חומרים שאסורים לפרסום בישראל:
חשוב להבהיר כי המאגר אינו מכיל את כל הבקשות שהתקבלו, אלא רק את הבקשות שהנמענים שלהן העבירו למאגר באופן וולנטרי. כך, אף שידוע שמחלקת הסייבר ויחידות אחרות בממשלת ישראל ביקשו הסרה של עשרות אלפי תכנים בשנים האחרונות, המאגר מכיל רק 44 בקשות שמיוחסות לגורמים ממשלתיים בישראל. ייתכן שבקשות אלה מסווגות כבקשות פרטיות, או מיוחסות לנושאים אחרים, ולכן אינן מופיעות בחיפוש ישיר.
הבקשות שמועלות למאגר יכולות לכלול תוכן רגיש או להתייחס לתכנים רגישים, כמו תכנים מיניים שהופצו ללא אישור, או תכנים רגישים ופרטיים הקשורים לחטופים ולקורבנות מלחמה. פרטי השולחים לעיתים נמחקים מהבקשות טרם העלאתן למאגר. אולם, לעיתים תוכן הבקשות עצמן עשוי לחשוף את הפונים לפגיעה נוספת בפרטיותם, מבלי שקיים הליך מסודר להסרת הבקשה מהמאגר.
לדוגמה, כשאדם מבקש את הסרת שמו מאתר אינטרנט מסוים, עדיין ניתן יהיה לראות את שמו בתוכן הבקשה, כפי שניתן לראות בפניה הזו שהוגשה לגוגל בשל פגיעה בפרטיות ולשון הרע (שם הפונה הושחר בתמונה אך חשוף במאגר):