програма цензор

Изследователски екип в Китай твърди, че е разработил текстова програма – цензор, която може да филтрира „вредната информация“ в Интернет с безпрецедентна точност, използвайки изкуствен интелект. Традиционните машинни цензори разчитат предимно на ключови думи, за да постигнат това и се борят за постигане на 70% точност, докато технологията с изкуствения интелект, която трябва да бъде обучена от хората, е достигнала до около 80% през последните години.

Екипът от университета Шенян Лигонг и Китайската академия на науките казват, че тяхната технология за изкуствен интелект не трябва да се обучава от хората и „надминава други подходи“, за да постигне точност над 91%.

Би било особено полезно да „идентифицираме и филтрираме чувствителна информация от онлайн новинарските медии“, пишат водещият изследовател Ли Шу и нейните колеги в статия, публикувана в Journal of Chinese Computer Systems в понеделник.

Китай има повече от 900 милиона потребители на интернет, повече от която и да е друга държава, и изгражда най-големите 5G мрежи в света за повишаване на скоростта на комуникация. Но интернет е строго контролиран, като много сайтове са блокирани, включително Google, Facebook, Twitter и някои чуждестранни информационни бюлетини – и голяма част от съдържанието в сайтовете, които са на разположение, е забранено.

Забранените теми са широкообхватни – от порнография до култове, злоупотреба с наркотици, употреба на огнестрелно оръжие, тероризъм и атаки срещу Комунистическата партия и нейните висши лидери.

Но идентифицирането им е предизвикателство за компютрите. Китайският е един от най-сложните езици в света, с близо 10 000 знака. А чувствителните думи – например пистолет – могат да бъдат взети в нечувствителен контекст, да задействат фалшива аларма или незаконна информация да бъде публикувана онлайн, без да се използват чувствителни думи.

Вместо това китайското правителство и интернет компаниите разчитат на огромна армия от цензори, за да проверяват ръчно онлайн съдържанието, но е твърде скъпо и неефективно, за да се справи с нарастването на информацията в китайския интернет и социалните медии.

Ли, доцент по компютърни науки в университета Шенян Лигонг, заявява, че технологията, разработена от нейния екип, може да е в крак с бързо развиващия се език, използван онлайн в Китай, благодарение на мощен речник, съдържащ не само чувствителни думи, но и променящите им се форми.

Тя добави, че изкуственият интелект може да чете и между редовете при търсене на незаконно съдържание, което е скрито в различен контекст, увеличавайки способността да се идентифицира текст, който е написан по начин, който заобикаля машинните цензури. Много потребители на интернет в Китай избягват да използват чувствителни думи и вместо това използват омоними или добавят тирета между знаците, за да объркат цензурата.

Част от технологията за цензура идва от Google, разкрива Ли. През 2017 г. Google разработва езиков модел с отворен код, известен като двупосочни представяния на кодери от трансформатори или BERT, за да помогне на своята търсачка да разбере по-добре термините за търсене на потребителите. BERT може да чете дума в различен контекст – като „препускане с кон“ срещу „сърдечно препускане“ – в резултат на четене на огромни текстови бази данни, включително целия сайт на Уикипедия.

Но BERT не е цензор по замисъл и не може да разбере текст, по-дълъг от 512 думи. За да работи, машината на Ли разбива дълъг текст на сегменти, позволява на BERT да чете по-късите части и използва друг инструмент базиран на изкуствен интелект, за да комбинира резултатите и да ги оцени с помощта на най-актуалния речник.

Google не пожела да коментира тази информация.

Китай инвестира сериозно в изкуствен интелект и технологията все повече се превръща в част от ежедневието в Китай – от електронната търговия, през публичните пространства, където камерите за наблюдение са оборудвани с разпознаване на лица, до военните нужди.

Вижте още:
САЩ отново лидер по инвестиции в изкуствен интелектСъединените щати отново са лидер по инвестиции в изкуствен интелект, сочи доклад на изследователскат…Nov 5 2019skafeto.com

Дейтизъм – нова идеология в цифровия свят по Ювал Ноа ХарариЗа първи път терминът „дейтизъм“ е споменат от Дейвид Брукс в неговата статия от 2013 г. Във „Филосо…Jan 11 2021skafeto.com

loading...