Новости Украины
Среда, 15 октября, 2025
No Result
View All Result
  • Украина
  • Мир
  • Политика
  • Технологии
  • Экономика
  • Украина
  • Мир
  • Политика
  • Технологии
  • Экономика
No Result
View All Result
Новости Украины
No Result
View All Result

Wikimedia зробила дані Вікіпедії зручнішими для штучного інтелекту

04.10.2025
0
24
SHARES
Share on FacebookShare on Twitter

Wikimedia представила проєкт у Німеччині, що дозволяє системам ШІ легше працювати з Вікіпедією та Вікіданими. Завдяки семантичному пошуку майже 120 мільйонів записів тепер доступні за змістом, а не лише за ключовими словами.

У Німеччині представили новий проєкт, який дозволить системам штучного інтелекту легше працювати з Вікіпедією та Вікіданими. Завдяки семантичному пошуку майже 120 мільйонів записів тепер можна буде знаходити за змістом, а не лише за ключовими словами, пише УНН із посиланням на TechCrunch.

Читайте так-же

У ЗСУ впроваджують телемедицину й роботизовану евакуацію – Сирський про нові рішення для фронту

У ЗСУ впроваджують телемедицину й роботизовану евакуацію – Сирський про нові рішення для фронту

15.10.2025
"Укрпошта" запускає власні поштомати з унікальними функціями: що чекає на українців

"Укрпошта" запускає власні поштомати з унікальними функціями: що чекає на українців

14.10.2025

Деталі

"Система під назвою "Проєкт вбудовування Wikidata" застосовує векторний семантичний пошук — техніку, яка допомагає комп’ютерам розуміти значення та зв’язки між словами — до існуючих даних у Вікіпедії та її сестринських платформах, що складаються з майже 120 мільйонів записів", — пише видання.

Поєднанні з підтримкою нового протоколу контексту моделі (MCP) — стандарту, який дозволяє системам штучного інтелекту ефективніше працювати з джерелами даних, — "проєкт відкриває можливість виконувати запити природною мовою безпосередньо до LLM". Ініціативу, як вказано, реалізувало німецьке відділення Wikimedia у співпраці з компанією нейронного пошуку Jina.AI та DataStax, що спеціалізується на технологіях обробки даних у режимі реального часу.

Як це працювало раніше

Вікідані роками пропонували машинозчитувані дані з ресурсів Вікімедіа, але попередні інструменти дозволяли лише пошук за ключовими словами та запити SPARQL — спеціалізовану мову запитів. Нова система краще працюватиме із системами доповненого пошуку (RAG), які дозволяють моделям штучного інтелекту отримувати зовнішню інформацію, надаючи розробникам можливість базувати свої моделі на знаннях, перевірених редакторами Вікіпедії.

Дані також структуровані таким чином, щоб забезпечити важливий семантичний контекст. Наприклад, запит до бази даних за словом "вчений" видасть списки видатних вчених-ядерників, а також вчених, які працювали в Bell Labs. Також є переклади слова "вчений" різними мовами, зображення вчених за роботою та осіб, пов’язаних поняттям "дослідник" та "науковець".

Суть нового проєкту

Новий проєкт з’являється на тлі того, що розробники штучного інтелекту намагаються знайти високоякісні джерела даних, які можна використовувати для точного налаштування моделей. Самі навчальні системи стали складнішими — часто вони збираються як складні навчальні середовища, а не як прості набори даних, але для належного функціонування вони все ще потребують ретельно відібраних даних.

Для систем штучного інтелекту, які вимагають максимальної точності, потреба у перевірених і надійних даних є особливо гострою. І хоча Вікіпедію іноді недооцінюють, її інформація значно більш фактологічно орієнтована, ніж загальні масиви даних на кшталт Common Crawl — величезної збірки вебсторінок з усього інтернету, ідеться у публікації.

Втім, пошук якісних даних може мати високу ціну для лабораторій ШІ. Так, у серпні компанія Anthropic погодилася врегулювати позов групи авторів, чиї твори використовувалися як навчальні матеріали, і виплатити 1,5 мільярда доларів, щоб уникнути подальших претензій.

Керівник проєкту Wikidata AI Філіп Сааде у заяві для преси підкреслив незалежність ініціативи від великих ШІ-лабораторій та технологічних корпорацій.

Запуск цього проєкту Embedding Project показує, що потужний штучний інтелект не обов’язково повинен контролюватися жменькою компаній. Він може бути відкритим, спільним та створеним для обслуговування всіх

— сказав Сааде журналістам.

У TikTok ширяться відео, згенеровані ШІ, які просувають наратив "миру за будь-яку ціну" — ЦПД РНБО01.10.25, 13:41 • 2190 переглядiв

Share10Tweet6Share2

ДРУГИЕ НОВОСТИ

У ЗСУ впроваджують телемедицину й роботизовану евакуацію – Сирський про нові рішення для фронту
Технологии

У ЗСУ впроваджують телемедицину й роботизовану евакуацію – Сирський про нові рішення для фронту

15.10.2025
0

Головнокомандувач ЗСУ Олександр Сирський повідомив про впровадження телемедицини та роботизованої евакуації. Це спрямовано на захист життя військовослужбовців та вдосконалення медичного...

Read more
"Укрпошта" запускає власні поштомати з унікальними функціями: що чекає на українців

"Укрпошта" запускає власні поштомати з унікальними функціями: що чекає на українців

14.10.2025
ChatGPT дозволить еротичний контент для повнолітніх користувачів вже з грудня

ChatGPT дозволить еротичний контент для повнолітніх користувачів вже з грудня

14.10.2025
Міноборони вперше закуповує модульні бронежилети з розширеною комплектацією

Міноборони вперше закуповує модульні бронежилети з розширеною комплектацією

14.10.2025
Провал найбільшої криптобіржі Binance: що стало причиною збитків у $19 мільярдів

Провал найбільшої криптобіржі Binance: що стало причиною збитків у $19 мільярдів

14.10.2025
Next Post
Представитель ЕС по санкциям: мы на грани потенциального крупного конфликта и не готовы к его разрешению

Представитель ЕС по санкциям: мы на грани потенциального крупного конфликта и не готовы к его разрешению

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Опрос

Пошли бы вы на уступки русне из-за отсутствия света\тепла?
Результаты

ТОП НОВОСТИ

Меньше коррупции и субъективности: проверки бизнеса станут автоматизированными

Меньше коррупции и субъективности: проверки бизнеса станут автоматизированными

15.10.2025
Правительство призывает общины не спешить с отопительным сезоном, сохраняя ресурсы — Кулеба

Правительство призывает общины не спешить с отопительным сезоном, сохраняя ресурсы — Кулеба

15.10.2025
У ЗСУ впроваджують телемедицину й роботизовану евакуацію – Сирський про нові рішення для фронту

У ЗСУ впроваджують телемедицину й роботизовану евакуацію – Сирський про нові рішення для фронту

15.10.2025
Правительство усилило требования к локализации в публичных закупках: что изменится для производителей

Правительство усилило требования к локализации в публичных закупках: что изменится для производителей

15.10.2025
Ермак встретился с производителями ПВО в Вашингтоне

Ермак встретился с производителями ПВО в Вашингтоне

15.10.2025
  • Добавить новость
Реклама: digestmediaholding@gmail.com Редакция: uatime.net@gmail.com

Использование любых материалов сайта разрешается при условии ссылки на uatime.net
Интернет-СМИ должны использовать прямую открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала. Редакция сайта может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

© 2016-2025 Новости Украины. All Rights reserved.

No Result
View All Result
  • Украина
  • Мир
  • Политика
  • Технологии
  • Экономика

Использование любых материалов сайта разрешается при условии ссылки на uatime.net
Интернет-СМИ должны использовать прямую открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала. Редакция сайта может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

© 2016-2025 Новости Украины. All Rights reserved.

wpDiscuz
0
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x
| Ответить