רשימת קריאה

רשימת הקריאה מאפשרת לך לשמור כתבות ולקרוא אותן במועד מאוחר יותר באתר,במובייל או באפליקציה.

לחיצה על כפתור "שמור", בתחילת הכתבה תוסיף את הכתבה לרשימת הקריאה שלך.
לחיצה על "הסר" תסיר את הכתבה מרשימת הקריאה.

לרשימת הקריאה המלאה לחצו כאן

את הכתבה הזאת היה יכול לכתוב גם אלגוריתם

לכתבה

הבינה המלאכותית הצליחה להשתלט גם על אחד המעוזים החשובים ביותר שמחזיקים בני האדם: כתיבת תוכן ■ האלגוריתם של ארטיקולו הישראלית יכול לכתוב בתוך שתי דקות מאמר רהוט וענייני של 500 מילה, ואפילו מרצה להיסטוריה לא יצליח לזהות שרובוט כתב את העבודה ■ המייסדים: "כל העולם עובר לבינה מלאכותית - ואי־אפשר לברוח מזה" ■ כתבה שלישית בסדרה

19תגובות

כתיבת תוכן יכולה להיות כאב ראש לא קטן לבעלי אתרים, שצריכים להשקיע בכך זמן, כוח אדם מיומן וכסף. במציאות הדיגיטלית הנוכחית, כדי לשמור על קשר עם לקוחות ולמשוך קהל חדש, חייבים המותגים, החברות ובעלי עסקים בינוניים וקטנים, לנהל אתר אינטרנט, רשימת תפוצה במייל ופרופיל ברשתות החברתיות.

נכון להיום, יש יותר ממיליארד אתרי תוכן בכל העולם, ביום אחד נכתבים כ–4 מיליון בלוגים ועל פי חברת המחקר רדיקטי, כ–215 מיליארד מיילים שיווקיים נשלחים מדי יום. אמנם יצרני תוכן וכותבי מאמרים לא נמצאים במקום גבוה בדירוגי השכר, אבל עבור עסקים קטנים ובינוניים, כתיבת תוכן מקורי היא מעמסה כלכלית לא קטנה ובחברות הגדולות יותר, שזקוקות לכמויות גדולות של תוכן מקורי להפצה ולשמירה על נוכחות במרחב הדיגיטלי, ההוצאה יכולה להצטבר לסכומים משמעותיים.

את החלל הזה מנסה למלא הסטארט־אפ הישראלי ארטיקולו, עם פתרון שמאפשר להפוך את תהליך כתיבת הטקסט לעניין פשוט ובמחיר נמוך — וכל זאת באמצעות בינה מלאכותית. בארטיקולו יצרו כלי טכנולוגי המבוסס על אלגוריתם, שמייצר בתוך כשתי דקות מאמר איכותי (לא מועתק) באורך של עד 500 מלים, לפי כל נושא שייבחר עבורו. קורא אנושי שיבחן את הטקסט לא יוכל לזהות אם מחבר הטקסט הוא אדם או מכונה.

"בכל מה שקשור לבינה מלאכותית, תהליך הייצור של מאמר קוהרנטי הוא מסובך", מסביר דורון טל, ממייסדי החברה. "הפתרון שלנו מאפשר לנסח מחדש פיסות תוכן שכבר קיימות במרחב הדיגיטלי ולהגיש אותן בצורה אחידה ובשפה ברורה ותקנית".

מייסדי ארטיקולו ריסרץ' ניר חלואני, ליליה דמידוב ודורון טל
מוטי מילרוד

הרעיון המקורי של ארטיקולו היה לקחת את כלי הבינה המלאכותית הזה לעולם החינוך, כדי לעזור לסטודנטים לכתוב עבודות לאוניברסיטה, אבל מהר מאוד התברר למייסדים כי דווקא בעולמות השיווק הצורך באוטומציה של הכתיבה דחוף יותר. "בעשור האחרון עולם הפרסום השתנה לחלוטין. מכיוון שכיום הצרכנים מחפשים ערך ולא מושפעים רק מסיסמאות, המשקל וההשקעה של החברות והמותגים עברו לתוכן", אומר טל.

את הסטארט־אפ ייסדו לפני שנתיים טל ושותפיו ד"ר ניר חלואני וליליה דמידוב, שלכל אחד מהם עבר עשיר בתחום דחיסת נתונים ובפרסום באינטרנט. בשנה שעברה ארטיקולו היה אחד מתוך שמונה סטארט־אפים שהתקבלו לאקסלרטור היוקרתי של יבמ, מה שמקנה למייסדיו גישה לעבודה על אחת ממערכות הבינה המלאכותית המתקדמות בעולם — ווטסון.

"בתוך חודש וחצי סגרנו גיוס הון ראשוני (סיד) של כמיליון דולר, ובמשך שנה עבדנו על האלגוריתם הבסיסי. החזון שלנו היה לבנות מכונה מבוססת אינטליגנציה מלאכותית, שיכולה לכתוב מאמר שאנשים יחשבו שאדם כתב אותו. היה לנו חשוב גם שהטקסט ייראה מקורי ולא מועתק", אומר טל.

"בכל פלח שוק — אם המאמר מועתק ולא ייחודי, אין לזה משמעות, אפשר גם להשתמש בגוגל כדי להוציא טקסט. עשינו תהליך ארוך של QA (בדיקות תוכנה) וזיהינו בעיות וטעויות, ובכל פעם שיפרנו את האלגוריתם מחדש. זה תהליך שלא נגמר — אנחנו תמיד משפרים אותו ואנחנו בדרך לרשום פטנט על המוצר", הוא מוסיף.

בשנה שעברה ארטיקולו היה אחד מתוך שמונה סטארט־אפים שהתקבלו לאקסלרטור היוקרתי של יבמ, מה שמקנה למייסדיו גישה לעבודה על אחת ממערכות הבינה המלאכותית המתקדמות בעולם — ווטסון

מתוך חדר התנסות של מחשב העל ווטסון מבית יבמ
בלומברג

"70% מהתוכן באנגלית נכתב על ידי הודים"

מה אתם חושבים על איכות הטקסטים שמייצרת המכונה?

טל: "לפני חצי שנה החלטנו להעלות פיילוט והגענו למצב שבו 100% מהמאמרים הם ייחודיים. אנחנו במצב שאנחנו מרוצים מהתוצאה, לא נתקלנו במשפט שאין בו היגיון. איכות זה עניין סובייקטיבי, אנחנו באמצע הדרך להגיע למטרה".

איך המערכת מתמודדת עם תופעת החדשות המזויפות? מה יקרה אם האלגוריתם יתבסס על מאמר מפוברק?

"בהגדרה, החיפוש של האלגוריתם אחר מקורות מכוון למקורות שהם 'מאמרים' באופיים. לרוב אנחנו נמנעים משהשתמש בתכנים של אתרי חדשות או בלוגים שמתעסקים באקטואליה כמקור למאמר. כך הסיכון ליפול על 'פייק ניוז' נמוך.

"ברור שגם בעולם של מאמרים אנחנו יכולים ליפול על דברים לא נכונים, אבל זה נעשה באותה דרך שבה כותב אנושי היה מחפש מקורות ומוצא משהו שהוא לא יודע מה המקור שלו. הסיכוי שלנו ליפול שם הוא נמוך יותר כי עשינו סיווג של מקורות, וכך אנחנו מצמצמים את הסיכוי לשימוש במקורות פחות אמינים".

כמה משתמשים יש לארטיקולו?

"33 אלף משתמשים שייצרו לפחות מאמר אחד, מהם בסביבות 2,000 לקוחות משלמים. כ–7% מהנרשמים נהפכו ללקוח משלם. מתוך הלקוח המשלם, קרוב ל–60% הם מנויים — לקוחות חוזרים.

"מבחינה אסטרטגית, המטרה שלנו היא לפנות לחברות גדולות וארגונים שצריכים תוכן מקורי בכמות ותדירות גבוהה. התחלנו פיילוטים עם כמה חברות מתחום הפרסום משולב חוויה (Native Advertising) ומתחום התוכן, ואנחנו בוחנים את היכולות של הכלי להתמודד עם עבודה בהיקפים גדולים. טווח המחירים מתחלק בין כאלה שרוכשים מנוי למשתמשים המעוניינים במספר מוגבל של מאמרים. עשרה מאמרים עולים 19 דולר ו–100 מאמרים עולים 99 דולר. לעומת זאת, מנויים יוכלו לייצר 30 מאמרים ב–29 דולר ולהגיע ל–250 מאמרים ב–99 דולר".

"בעשור האחרון עולם הפרסום השתנה לחלוטין. מכיוון שכיום הצרכנים מחפשים ערך ולא מושפעים רק מסיסמאות, המשקל וההשקעה של החברות והמותגים עברו לתוכן" דורון טל

פרסומות באינטרנט
dno1967b (cc-by)

מי המתחרים שלכם? יש חברות נוספות שעוסקות ביצירת תוכן על ידי אינטליגנציה מלאכותית?

"עשינו מחקר ובדקנו אילו פתרונות נוספים יש בתחום — אף אחד מהם לא נותן פתרון שלם כמו שלנו. למשל, תוכנות הנקראות ספינרים יודעות לקחת טקסט או מלה ולהחליף אותה למלה דומה או נרדפת. הבעיה היא שהם לא עושים ניתוח של הטקסט ולכן הם עלולים לייצר טקסט לא קוהרנטי. מלכתחילה צריך את המאמר המקורי שעליו מתבצע הספין. הסטארט־אפ נרטיב סיינס, למשל, שכותב תקצירים, יודע גם לכתוב טקסט — אבל הם מבוססים על תבניות. אנחנו לא מספרים סיפור טכני, אלא מביאים את זה לחברות שצריכות תוכן מקורי בתדירות גבוהה וכמות גדולה.

"בגדול, אנחנו מנסים לייעד את המערכת לטקסטים בפורמט מאמר, לכן המתחרים העיקריים שלנו הם כותבים אנושיים. מחקרים מראים כי 70% מהתוכן שעולה באנגלית לאינטרנט נכתב על ידי הודים. יש המוני אתרים של כתיבת מאמרים שהודים מייצרים במחיר יחסית גבוה. במהלך הפיילוט הבנו שקיים ביקוש ושאנשים מוכנים לשלם. בשלב הבא נוכל להעלות את המחיר כי כמעט שאין לנו תחרות, וכשהחלופה העיקרית היא כותבים אנושיים, למחיר המוצר הסופי יש משמעות רבה".

מאיים על משרתם של כותבי תוכן?

לדברי טל, הפגישות עם לקוחות פוטנציאליים העלו דרישות רבות ובהתאם לצורכי הלקוחות פיתחו אנשי החברה כלים נוספים, כמו כלי שיוכל לייצר כותרות למאמרים קיימים. כדי להשתמש במחולל הכותרות של ארטיקולו מכניסים לינק לעמוד שרוצים לתת לו כותרת והוא קורא את העמוד, מבין את הקונספטים שבו ונותן תקציר של העמוד.

המון מסכים
Dreamstime

"עוד כלי שיש בו צורך הוא למצוא ציטוטים, תמונות ותמצות. תמצות טקסט, למשל, עושים על ידי הקלדת הטקסט, קביעה של מספר המשפטים שרוצים שהוא יהיה — וזה מתמצת. אפשר לקחת למשל טקסט של שלושה עמודים ולבקש מהכלי שיתמצת אותו לעשרה משפטים", מסביר טל.

אז עיתונאים צריכים להתחיל לחפש קריירה חדשה?

"אנחנו לא הולכים להחליף עיתונאים. זהו כלי עזר לסוגים רבים של משתמשים. עדיין יש עיתונאים שעוברים על התוכן, עורכים אותו ובמקרה שלנו גם מתרגמים אותו. הגענו למסקנה שעיתונאים וכותבים מקצועיים מעדיפים לא לתת לאלגוריתם לכתוב במקומם והם אפילו נרתעים מאלגוריתם כזה. מצד שני, הם היו שמחים לקבל עזרה בכתיבה, בעיקר בשלבים ההתחלתיים שבהם הם יושבים מול דף ריק וצריכים נקודת התחלה כלשהי.

"זה לא מייתר את הכותבים — ההפך, זה אפילו מדגיש את החשיבות של כותב אנושי, כי הוא אף פעם לא יהיה כמו עיתונאי, עם הבחנות ותובנות. הוא יכול להקל עליו, אבל לא להחליף לחלוטין. יעבור עוד הרבה זמן עד שמכונה תחליף לחלוטין הכותב האנושי".

בכל זאת, הפיתוח שלכם מעלה שאלה לגבי עבודת הכותב או העיתונאי — האם ראוי שיפורסמו דברים שנכתבו בידי מכונה ולא המפרסם עצמו?

"אני לא רואה בעיתונאי שמשתמש בארטיקולו, נעזר בכלים טכנולוגיים כדי לקבל רעיונות ולנסח אותם — כלא אתי. כל העולם עובר לבינה מלאכותית ואי־אפשר לברוח מזה".

בחודשים האחרונים פנו לחברה כמה אתרי תוכן כדי להתנסות בכלי וישנם כמה שיתופי פעולה עם חברות שונות, שהפכו לקבועים. אחת הדוגמאות הוא BITA, בלוג טכנולוגיה יפני שמשתמש באלגוריתם של ארטיקולו כדי לכתוב מאמרים שעוסקים בעיקר בסקירות וחדשות טכנולוגיות. שיתוף הפעולה עם הבלוג הביא לעליית המודעות לחברה ביפן והעלה את שיעור לקוחות החברה במדינה ל–15%.

הכלי של ארטיקולו מעלה שאלות רבות לגבי יצירת תוכן באופן אוטומטי וללא מגע אדם. מלבד העובדה שהוא מאיים על משרתם של כותבי תוכן רבים ועיתונאים, אף שלטענתו של טל הוא לא — תוכן שנכתב בידי מכונה מחייב כרגע את מי שמזמין את הטקסט, לבדוק ולאמת את התוכן במקרים מסוימים כדי שלא יפורסם מידע שגוי. פעולה זו כבר הופכת את העיסוק בהכנת הטקסט לארוכה יותר ממה שהתכוון מזמין הטקסט.

"זה לא מייתר את הכותבים — ההפך, זה אפילו מדגיש את החשיבות של כותב אנושי, כי הוא אף פעם לא יהיה כמו עיתונאי, עם הבחנות ותובנות. הוא יכול להקל עליו, אבל לא להחליף לחלוטין. יעבור עוד הרבה זמן עד שמכונה תחליף לחלוטין הכותב האנושי" דורון טל

מתוך הסדרה "ווסטוורלד", המראה את מחולל המילים של הרובוטים בפעולה

ואולם מטרת ארטיקולו היא לייצר טקסט פשוט — לא חדשותי ולא אקדמי. על כן ארטיקולו מצליחים לענות על הביקוש הגבוה שקיים כיום בשוק ליצור במהירות כמויות גדולות של תוכן רלוונטי, קוהרנטי ומדויק יחסית.

ללא מגע יד אדם (כמעט)

טקסט בינה מלאכותית

הטקסט המופיע למעלה, שכותרתו "ההשלכות הכלכליות של שינויי האקלים", נכתב כולו על ידי מערכת הבינה המלאכותית של ארטיקולו. כל מה שאנחנו עשינו היה לבחור את הנושא (עד חמש מלים) ולהגביל את אורכו ל–250 מלים באנגלית.

האלגוריתם של המערכת ניתח כל מלה בהגדרת הנושא, סרק את הרשת ובחר את המקור העיקרי שעליו ביסס את המאמר. לאחר מכן, התוכנה איתרה תכנים נוספים הקשורים בנושא המבוקש, וחיברה משפטים מרכזיים מהם לטקסט. לבסוף עבר המאמר הגולמי שכתוב ועריכה טקסטואליים באמצעות מנוע NLP, כדי לוודא שהוא קריא ומובן. כל התהליך הזה נמשך לא יותר משתי דקות.

מכיוון שבשלב הזה האלגוריתם מסוגל ליצור טקסטים באנגלית בלבד, לצורך כתיבת הטקסט הוזנו המלים הבאות: Financial Implications of Climate Change. כדי לצמצם למינימום את המעורבות האנושית בהפקת המאמר, הופקדה גם מלאכת התרגום בידי מכונה — גוגל טרנסלייט. לא נעשו כאן פעולות עריכה מקיפות בכוונה תחילה, אולם במעבר מאנגלית לעברית היה צורך לבצע עריכה קלה בלבד בטקסט שהמערכת של גוגל תירגמה לעברית.



תגובות

דלג על התגובות

בשליחת תגובה זו הנני מצהיר שאני מסכים/מסכימה עם תנאי השימוש של אתר הארץ

סדר את התגובות