OpenAI представила новый стандарт оценки мед ИИ

By: block-chain24|2025/05/14 12:15:08

Компания представила HealthBench —открытый набор данных и оценочный инструмент, созданный для тестирования LLM на их способность обрабатывать медицинские диалоги. Он включает 5000 реалистичных медицинских разговоров, которые охватывают 26 медицинских специальностей, таких как нейрохирургия и офтальмология, и поддерживает 49 языков, включая ахмарский и непальский. Эти разговоры моделируют реальные сценарии взаимодействия между пациентами и врачами, что делает бенчмарк уникальным в своей реалистичности и масштабе. Основная цель HealthBench — оценить, насколько точно и безопасно ИИ-модели могут отвечать на запросы, связанные со здоровьем. Каждый ответ модели оценивается по специально разработанным рубрикам, созданным врачами, которые учитывают клиническую точность, полноту и соответствие медицинским стандартам. Рубрики содержат 48 562 уникальных критерия, что позволяет проводить глубокую и детализированную оценку. Запуск HealthBench вызвал интерес не только в медицинской и ИИ-сферах, но и в криптовалютном секторе. Некоторые аналитики предполагают, что стандартизация оценки медицинских ИИ-моделей может стимулировать спрос на блокчейн-решения в здравоохранении, особенно для управления медицинскими данными и обеспечения прозрачности. Несмотря на новаторский характер HealthBench, эксперты подчеркивают, что бенчмарк не является исчерпывающим. Реальная клиническая практика сложнее, чем смоделированные диалоги, и требует дополнительного тестирования в реальных условиях. Некоторые эксперты выражают скептицизм относительно заявлений, что ИИ в 4 раза превосходит врачей, указывая на необходимость критической оценки таких утверждений.

Вам также может понравиться

Деконструкция публичной цепочки игры капитала Pharos: Поддерживается ли оценка в 950 миллионов долларов, обеспеченная активами, такими как фотоэлектрические установки, просто транзакцией-оболочкой под слоями ставок?

Когда компания из реального сектора вкладывает реальные активы в проект уровня 1, она может легко создать оценку в 950 миллионов долларов, умножив стоимость реальных активов несколько раз. Неужели такая игра капитала слишком возмутительна? Действительно ли крипторынку нужны такие RWA?

a16z: ИИ делает всех в 10 раз более продуктивными, но истинный победитель еще не появился

Институциональный ИИ и розничный ИИ "Лучшая интеграция" - неизбежный тренд.

На самом деле масштабирование ETH является важным преимуществом для L2

ETH наконец признал поражение — его дорожная карта, ориентированная на Rollup, неосуществима, в то время как монометрические решения для масштабирования, принятые блокчейнами, такими как Solana, оказались верными.

Воспоминания: 10 ключевых вкладов основной команды TON, о которых мало кто знал в первые дни

Каждая строка кода, каждый инструмент, который мы создаем, каждая бессонная ночь, проведенная в поддержке сети, - эти усилия заложили основу для развития TON сегодня.

Утренние новости | OpenAI получает инвестиции в размере 110 миллиардов долларов; Solana запускает Solana Payments; M0, MoonPay и PayPal совместно запускают PYUSDx

Обзор важных событий на рынке 27 февраля

2025 Южная Корея Постмортем листинга CEX: Инвестирование в новые монеты = 70% убытка?

Показатели нового токена на южнокорейской бирже в 2025 году структурно схожи с Binance, без значительных различий.

Анализ BIP-360: Первый шаг Биткойна к квантовому иммунитету, но почему только "первый шаг"?

В этой статье объясняется, как BIP-360 изменяет стратегию квантовой защиты Биткойна, анализируются его улучшения и обсуждается, почему он еще не достиг полной постквантовой безопасности.

50 миллионов USDT обменены на 35 000 долларов США в AAVE: Как произошла эта катастрофа? Кого в этом винить?

Из-за критической уязвимости в маршруте транзакции операция DeFi на сумму 50 миллионов долларов была осуществлена практически без какой-либо защиты, в результате чего почти вся сумма средств испарилась в крошечном пуле ликвидности.

Диалог Виталика в Чианг-Май: Взрыв искусственного интеллекта: за что должен бороться крипто-мир?

Виталик беседует с Мишелем Бовеном: Размышляя о первоначальном намерении Ethereum, выступая за "регенеративный акселерационизм", чтобы глубоко внедрить крипто-технологии в глобальное сотрудничество и реальную производительную экономику.

ZachXBT раскрывает скандал с инсайдерской информацией в Axiom: как внутренние сотрудники злоупотребляют своими привилегиями?

Пользователи доверяют неизменности смарт-контрактов, но забывают, что в момент ввода личной информации и привязки своих кошельков они передают самую важную информацию полностью централизованной организации.

2026 год, как мы должны разумно оценить рыночную стоимость L1?

Из-за структурных характеристик открытых разрешительных сетей, транзакционные сборы и доходы от MEV публичных цепочек L1, таких как Биткойн, Эфириум и Солана, систематически арбитражируются и постоянно перенаправляются новыми моделями внутри экосистемы.

AWS финансового мира: Почему она становится крупнейшим победителем в эпоху ИИ + стейблкоинов

Стратегическое погружение в Stripe 2026: Не просто гигант платежей, но и превращение в глобальную финансовую операционную систему для эпохи ИИ и стейблкоинов благодаря приобретению Bridge и Privy.

Учреждения принимают криптовалюту, но практикующие специалисты испытывают необычную фрустрацию. Кто в конечном итоге победит?

Возможно, «институциональное усыновление» — это не миссия, а форма стратегии извлечения выгоды.

Рынок продолжает падать, когда же наступит лучшее время для TGE?

Единственное, что действительно превосходит циклы, — это качество самого проекта.

Когда все продают акции программного обеспечения, HSBC заявляет, что вы ошибаетесь

Паника на рынке - это неправильная оценка ситуации.

Почему биткойн, который должен был достичь 150 000 долларов, упал в цене вдвое, и кто на самом деле стоит за этим — Джейн Стрит?

Ровно в 10 утра рынок был разгромлен: Раскрытие секретов сложной машины, стоящей за подавлением цен на биткойны компанией Jane Street.

Как великий детектив ZachXBT стал мастером в решении странных дел?

В мире криптовалют никогда не было недостатка в героях и злодеях. Большинство героев - это основатели протоколов или инвесторы, которые идеально выбирают время для своих сделок. ZachXBT отличается. Он герой, потому что решает защищать людей, а не извлекать из них прибыль.

Утренний отчет | Kalshi впервые публично наказала инсайдерскую торговлю; STS Digital завершила финансирование на сумму 30 миллионов долларов; American Bitcoin объявила о финансовом отчете за 2025 год.

Обзор важных событий на рынке 26 февраля

Деконструкция публичной цепочки игры капитала Pharos: Поддерживается ли оценка в 950 миллионов долларов, обеспеченная активами, такими как фотоэлектрические установки, просто транзакцией-оболочкой под слоями ставок?

Утренние новости | OpenAI получает инвестиции в размере 110 миллиардов долларов; Solana запускает Solana Payments; M0, MoonPay и PayPal совместно запускают PYUSDx

Обзор важных событий на рынке 27 февраля

Основатель Binance CZ опубликовал на платформе X сообщение о том, что кошелек Binance Web3 теперь поддерживает фильтрацию ненужных транзакций, чтобы снизить риск заражения адресов. Из-за недавнего увеличения числа атак с отравлением адресов Ethereum он ранее призвал исследователей блоков напрямую фильтровать такие ненужные транзакции...

17:01

Главный подозреваемый по делу о отмывании денег с участием криптовалютной биржи BITGIN был привлечен к ответственности на Тайване, при этом сумма превысила 150 миллионов новых тайваньских долларов

Тайваньские прокуроры обвинили несуществующую криптовалютную биржу "BITGIN" и руководителей Bijing Technology, генерального директора Лю Юсена, генерального директора Чжан Ханьсена и операционного директора Чжан Ютинг, а также еще 10 человек, при этом братьям Чжан грозят 12 лет тюрьмы. Прокуроры утверждают, что компания сговорилась...

16:56

Модель выпуска обновлений Polkadot устанавливает максимальное количество DOT в размере 2,1 миллиарда

Polkadot объявил на платформе X, что обновление модели выпуска токенов официально вступило в силу. В этом обновлении протокола будет внесено несколько ключевых изменений, включая установление максимального объема выпуска нативного токена DOT в 2,1 миллиарда токенов, при этом уже выпущено около 80% токенов. В...

Еще

Сообщество

Бот службы поддержки：@WEEX_support_smart_Bot

VIP-программа：support@weex.com

App

О нас

Юр. соблюдение

Продукты

Поддержка

Услуги

OpenAI представила новый стандарт оценки мед ИИ

Вам также может понравиться

a16z: ИИ делает всех в 10 раз более продуктивными, но истинный победитель еще не появился

На самом деле масштабирование ETH является важным преимуществом для L2

Воспоминания: 10 ключевых вкладов основной команды TON, о которых мало кто знал в первые дни

Утренние новости | OpenAI получает инвестиции в размере 110 миллиардов долларов; Solana запускает Solana Payments; M0, MoonPay и PayPal совместно запускают PYUSDx

2025 Южная Корея Постмортем листинга CEX: Инвестирование в новые монеты = 70% убытка?

Анализ BIP-360: Первый шаг Биткойна к квантовому иммунитету, но почему только "первый шаг"?

50 миллионов USDT обменены на 35 000 долларов США в AAVE: Как произошла эта катастрофа? Кого в этом винить?

Диалог Виталика в Чианг-Май: Взрыв искусственного интеллекта: за что должен бороться крипто-мир?

ZachXBT раскрывает скандал с инсайдерской информацией в Axiom: как внутренние сотрудники злоупотребляют своими привилегиями?

2026 год, как мы должны разумно оценить рыночную стоимость L1?

AWS финансового мира: Почему она становится крупнейшим победителем в эпоху ИИ + стейблкоинов

Учреждения принимают криптовалюту, но практикующие специалисты испытывают необычную фрустрацию. Кто в конечном итоге победит?

Рынок продолжает падать, когда же наступит лучшее время для TGE?

Когда все продают акции программного обеспечения, HSBC заявляет, что вы ошибаетесь

Почему биткойн, который должен был достичь 150 000 долларов, упал в цене вдвое, и кто на самом деле стоит за этим — Джейн Стрит?

Как великий детектив ZachXBT стал мастером в решении странных дел?

a16z: ИИ делает всех в 10 раз более продуктивными, но истинный победитель еще не появился

На самом деле масштабирование ETH является важным преимуществом для L2

Воспоминания: 10 ключевых вкладов основной команды TON, о которых мало кто знал в первые дни

Утренние новости | OpenAI получает инвестиции в размере 110 миллиардов долларов; Solana запускает Solana Payments; M0, MoonPay и PayPal совместно запускают PYUSDx

2025 Южная Корея Постмортем листинга CEX: Инвестирование в новые монеты = 70% убытка?

Популярные монеты

Последние новости криптовалют

Данные: С анонимного адреса было переведено 192 BTC, что составляет приблизительно 13,72 миллиона долларов США.

Данные: Текущая средняя 8-часовая ставка финансирования для ETH по сети составляет 0.0018%

CZ: Веб-кошелек Binance Web3 теперь поддерживает фильтрацию спам-транзакций, чтобы снизить риски отравления адресов

Модель выпуска обновлений Polkadot устанавливает максимальное количество DOT в размере 2,1 миллиарда