Как пишет обозреватель Financial Times, «DeathGPT» вычисляет вероятность определенных жизненных событий точно так же, как ChatGPT вычисляет вероятность появления слов в предложении. Алгоритм, разработанный в Дании, уже превзошел другие модели прогнозирования, в том числе актуарные расчеты, используемые в страховой отрасли.
Суне Леманн из Датского технического университета, который стоял во главе исследования, кратко прокомментировал изданию исследование.
«Я думаю, что сходство между текстом и жизнью глубоко и разнообразно. Для меня важно, что алгоритм может предсказать следующий шаг в жизни каждого человека», — сказал он.
И язык, и жизнь — это последовательности. Ученые использовали это сходство. Сначала они составили «словарь» жизненных событий, создав своеобразный синтетический язык, и использовали его для построения «предложений». Пример предложения: «В третьем классе школы-интерната у Гермионы было пять факультативных занятий».
Подобно тому, как большие языковые модели анализируют текст, чтобы найти связи между словами, алгоритм Life2vec, который получил реконструированные истории жизни 6 миллионов жителей Дании в период с 2008 по 2015 год, искал аналогичные связи в данных.
Чтобы проверить алгоритм, ученые проанализировали выборку из 100 000 человек в возрасте от 35 до 65 лет, из которых живы были только половина людей. Когда Life2vec попросили угадать, кто из них умер, алгоритм ответил правильно в 79% случаев. Исходя из слов Леманна, этот результат превысил лучшие модели прогнозирования на 11%.
Хотя в статье говорится, что «точные индивидуальные прогнозы действительно возможны», алгоритм вычисляет вероятность смерти в определенный период времени, но не называет дату. Однако есть оговорки: то, что применимо в Дании, может не применяться в других местах, а алгоритм кодирует различия в обучающих данных.
Создатели «калькулятора смерти» не хотят, чтобы их работа использовалась работниками страховых компаний, и пока держат алгоритм и данные в секрете.
Однако, как подчеркивают исследователи, самое интересное в Life2vec то, что он носит общий характер и не ориентирован на какую-то конкретную задачу. В существующих прогностических моделях исследователи должны заранее указывать важные переменные, такие как возраст, пол и доход. Life2vec, напротив, впитывает все данные и может самостоятельно выявлять соответствующие факторы (например, он обнаружил, что доход положительно связан с выживанием, тогда как проблемы психического здоровья влияют отрицательно). Это может привести исследователей к ранее неизученным факторам, влияющим на здоровье, и обнаружить новые связи между, казалось бы, несвязанными моделями поведения.