采集内容部分为空的解决办法
今天在采集51cto的数据的时候
出现了部分文章采集内容为空的情况
开始是不知道
因为采集600多文章
所以只看了开头两个
发现可以后就直接导入数据库了
遗憾的时候
导入后发现部分内容为空
也就是body段是空的
600多条数据,要一个一个找,当然会累死啊
所以就找到两个办法
第一个办法
在mysql执行如下sql语句
出现了部分文章采集内容为空的情况
开始是不知道
因为采集600多文章
所以只看了开头两个
发现可以后就直接导入数据库了
遗憾的时候
导入后发现部分内容为空
也就是body段是空的
600多条数据,要一个一个找,当然会累死啊
所以就找到两个办法
第一个办法
在mysql执行如下sql语句
Copy code
delete dede_addonarticle,dede_archives FROM dede_addonarticle,dede_archives where dede_addonarticle.body='' and dede_addonarticle.aid=dede_archives.id