Přednáška
Šité na míru vs. obecné: jazykové modely pro český web
19:45 - 20:10Místnost E112
Jak reprezentovat webové stránky ve vektorovém prostoru tak, aby vyhledávač co nejlépe porozuměl jejich obsahu a dokázal ho efektivně využít? Přednáška ukáže, jak v Seznamu vznikají modely strojového učení šité na míru konkrétním problémům a jak mohou v určitých scénářích překonat univerzální state-of-the-art (SOTA) řešení. Podíváme se přitom na technické výzvy spojené s trénováním enkodérových modelů.
Přednášející
Martin Dvořák

Martin absolvoval v roce 2021 obor strojového učení na FIT. Poté nastoupil jako výzkumník do společnosti Seznam.cz, kde se podílí na vývoji a zdokonalování vyhledávacího enginu. Ve své práci se zaměřuje na modely strojového učení v oblasti zpracování přirozeného jazyka a obrazu, přípravu potřebných dat i na co nejefektivnější trénování modelů v interním datacentru.