我原来就是这么干的,当然处理的数据不是电影就是。
fulin19860815 2022-06-12 22:11 开发者_如何学C
具体A,B哪张表做索引的话,一般用数据多的做索引好点,减少重复概率,匹配率一般有90%以上,当然如果数据量太大的话,遍历的话需要很久。
一盒辣酱 开发者_Python百科2022-06-12 22:23
你这两个表之间要有关联只可能通过title字段,如果遇到两部电影名字相同的情况就没办法了
都豆ABC 开发者_如何学C 2022-06-12 22:24
直接执行关联更新,再处理特殊情况
短小西西 202开发者_C百科2-06-12 22:28
把B表
的数据,设置到ES
(elasticsearch
)的索引,然后遍历A表
的数据,通过ES
搜索最匹配的结果,把id设置进去。这里你可以设置一个数组用来检测重复。重复的再多带带处理。
精彩评论