Пока все молятся на SAM2 от Метачки, опенсорсныe ребята взяли код и запили SAMURAI.
Для тех, кто в теме - поглядите видео и прикиньте количество времени на ротоскоп.
Причем он держит перекрытия другими людьми, дым, резкие движения.
Мне в субботу лень переводить непереводимые термины, просто скину все фичи сюда, а вы поглядите в репозиторий на гитхабе.
SAMURAI vs. MetaAI's SAM 2!
Traditional visual object tracking struggles in crowded, fast-moving, or self-occluded scenes, as does SAM2.
Meet SAMURAI: a completely open-source adaptation of the Segment Anything Model for zero-shot visual tracking!
Here's why it's a game-changer:
🚫 No need for retraining or finetuning
🎯 Boosts success rate and precision
🤖 Motion-aware memory selection
💪 Zero-shot performance on diverse datasets
But that's not all:
🔬 Refines mask selection
🔮 Predicts object motion effectively
📈 Gains: 7.1% AUC on LaSOT, 3.5% AO on GOT-10k
🏆 Competes with fully supervised methods without extra training
http...