може хтось знає модель чи мережу яка може обробляти великі блоки україномовного тексту (більше 15 000 символів), та у результаті повертати список тем що у цьому тексті обговорювалась? так собі хмара слів на стероїдах. наприклад текст подкасту на вході: ...бла...бла... нова машина хонди ...бла...бла... двигун потужний ...бла...бла... вартує дохера ...бла...бла... в стімі новий хіт ...бла...бла... покемони з пушками ...бла...бла... нінтендо плаче ...бла...бла...
на виході: - новий автомобіль від концерну хонда - гра про покемонів в стімі
я розумію шо це звучить як магія, але може хтось з подібними задачами грався?
я пробував годувати GPT-4 але на україномовний текст він погано відповідає, повторюється та галюценує, не знаходить ціли блоки. з коротким текстом ще більш менш, але коли тестові сегменти великі, то він не узагальнює. може таке завдання і не підсилу, хз, того і питаю.
У мене тут завалялись ключики до парочки інді ігор і хочу їх роздати, але не дуже хочу щоб вони попали до зіганутих. В мене по одній копії гри, віддаю першому написавшому назву гри в коментар до поточного посту. Також в написавшого не повинно бути рейтингу в ватана.
Дивіться щоб були відкриті особисті повідомлення.
TWO POINT CAMPUS
ARAGAMI 2
OTXO
THE RED LANTERN
HELL PIE
TWIN MIRROR
MIDNIGHT FIGHT EXPRESS
THE PALE BEYOND
LAST CALL BBS
FROM SPACE
GET TWO MONTHS OF IGN PLUS (Так і не зрозумів на що саме підписка)
WWE 2K23
UNPACKING
FRIENDS VS FRIENDS
THE LEGEND OF TIANDING