Разработана нейросеть для полного восстановления древних текстов
Международная группа из историков и IT-специалистов разработала искусственный интеллект для перевода и восстановления документов на древних языках.
В статье журнала Nature разработчики пишут, что содержание многих сохранившихся до наших времен документов сложно узнать из-за повреждений, а некоторые материалы не позволяют применять радиоуглеродное датирование, поэтому нельзя узнать возраст записи, что, в свою очередь, затрудняет ее интерпретацию.
Так появилась "Итака" — первая нейросеть, которая может восстановить недостающий текст на поврежденных записях, определить их происхождение и дату создания. Ее обучали на крупнейшем собрании греческих текстов. В ход шли как и целые документы, чтобы нейросеть могла понимать контекст, так и слова и отдельные символы.
Как объясняют разработчики — это расширенная версия предыдущей системы — "Пифии". "Итака" при восстановлении достигает точности в 62 процента, при определении места создания — точности в 71 процент. Она может датировать тексты с точностью до 30 лет. Систему уже опробовали историки для переоценки важных периодов греческой истории.
Кстати, создатели заявили о запуске бесплатной версии ИИ — для исследователей, преподавателей и сотрудников музеев. Чтобы сделать "Итаку" максимально ценным инструментом, разработали пособия, чтобы пользователи могли легко интерпретировать полученные с помощью системы данные, так как она генерирует несколько возможных вариантов восстановления текста — нужный выбирает ученый, опираясь на свой опыт.