шукаю допомоги заклиначів нейромереж

1СУ1ЮН
на. 1 6лаГе>скле>ННе.СШЬ,пидоры помогите,реактор помоги,Моя Україна,разная политота

може хтось знає модель чи мережу яка може обробляти великі блоки україномовного тексту (більше 15 000 символів), та у результаті повертати список тем що у цьому тексті обговорювалась?
так собі хмара слів на стероїдах.

наприклад текст подкасту
на вході:
...бла...бла... нова машина хонди ...бла...бла... двигун потужний ...бла...бла... вартує дохера ...бла...бла... в стімі новий хіт ...бла...бла... покемони з пушками ...бла...бла... нінтендо плаче ...бла...бла...

на виході:
- новий автомобіль від концерну хонда
- гра про покемонів в стімі

я розумію шо це звучить як магія, але може хтось з подібними задачами грався?

я пробував годувати GPT-4 але на україномовний текст він погано відповідає, повторюється та галюценує, не знаходить ціли блоки. з коротким текстом ще більш менш, але коли тестові сегменти великі, то він не узагальнює.
може таке завдання і не підсилу, хз, того і питаю.