我觉得厉害的调参侠,一定要直接敏锐手感好。首先从每年新出的大量灌水paper里面一眼就看到真正有用的干货,适合自己的dataset,并且解决特定问题,这个就不容易。很多paper在benchmark上表现很好,实际应用中就不是那回事了。然后是对具体模型的理解和操作,怎么调,怎么做实验,哪里是坑哪里是关键点,都要明白。同样的模型,有人能很快调好,有人就是搞半天不work,很难总结规律到底是差在哪一步,每个过程都不一样。


Giovanna 发表于 2021-12-01 08:22

同意这个,要是执着的按照paper写的去做这辈子都别想得到人家那个结果