首页 » 编程 » python » python使用filter函数删除列表中的空元素

在特定情况下会对内容进行切片处理,例如查询文章原创度,且根据逗号切片,这里使用split函数对字符串切割,切割的结果为列表,可能会出现空字符串元素,例如以下情况:

a = '我再学些python,python学起来真的很简单,你有兴趣话,可以学学试试看,'
print(a.split(','))
['我再学些python','python学起来真的很简单','你有兴趣话','可以学学试试看','']

以逗号切割后,最后一个逗号会称为空元素,这是可以使用 filter 函数过滤。

filter函数示例

filter(None, list)

filter函数类型为 filter,可以for循环遍历,但不能直接打印,如果想让结果转换为list,可以使用转回list:

list(filter(None, list))

为什么要用filter函数转回list?

在切片且删除空字符串后,需要随机抽取N个句子进行百度查询句子出现的次数,即原创度,这里使用的是随机,如果全部拿去查的话,会遇到这几个问题:
1、数量太多,查询浪费时间
2、百度封爬虫
为了解决整个问题,最好的方式就是随机句子查询,并且假设一个段落切片后随机查询3-5个句子,均出现非原创句子问题,表明源内容采集的可能性很大。

标签:
分享到:
赞(1) 打赏 生成海报

评论 抢沙发

4 + 5 =


长按图片转发给朋友

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

Vieu4.5主题
专业打造轻量级个人企业风格博客主题!专注于前端开发,全站响应式布局自适应模板。
切换注册

登录

忘记密码 ?

您也可以使用第三方帐号快捷登录

Q Q 登 录
微 博 登 录
切换登录

注册