шукаю допомоги заклиначів нейромереж
може хтось знає модель чи мережу яка може обробляти великі блоки україномовного тексту (більше 15 000 символів), та у результаті повертати список тем що у цьому тексті обговорювалась?
так собі хмара слів на стероїдах.
наприклад текст подкасту
на вході:
...бла...бла... нова машина хонди ...бла...бла... двигун потужний ...бла...бла... вартує дохера ...бла...бла... в стімі новий хіт ...бла...бла... покемони з пушками ...бла...бла... нінтендо плаче ...бла...бла...
на виході:
- новий автомобіль від концерну хонда
- гра про покемонів в стімі
я розумію шо це звучить як магія, але може хтось з подібними задачами грався?
я пробував годувати GPT-4 але на україномовний текст він погано відповідає, повторюється та галюценує, не знаходить ціли блоки. з коротким текстом ще більш менш, але коли тестові сегменти великі, то він не узагальнює.
може таке завдання і не підсилу, хз, того і питаю.