GVKun编程网logo

使用Python从文本中删除非英语单词(python删除非字母)

18

如果您想了解使用Python从文本中删除非英语单词和python删除非字母的知识,那么本篇文章将是您的不二之选。我们将深入剖析使用Python从文本中删除非英语单词的各个方面,并为您解答python删

如果您想了解使用Python从文本中删除非英语单词python删除非字母的知识,那么本篇文章将是您的不二之选。我们将深入剖析使用Python从文本中删除非英语单词的各个方面,并为您解答python删除非字母的疑在这篇文章中,我们将为您介绍使用Python从文本中删除非英语单词的相关知识,同时也会详细的解释python删除非字母的运用方法,并给出实际的案例分析,希望能帮助到您!

本文目录一览:

使用Python从文本中删除非英语单词(python删除非字母)

使用Python从文本中删除非英语单词(python删除非字母)

我正在使用python进行数据清理练习,正在清理的文本包含我要删除的意大利语单词。我一直在网上搜索是否可以使用nltk之类的工具包在Python上执行此操作。

例如给出一些文本:

"Io andiamo to the beach with my amico."

我想留下:

"to the beach with my"

有人知道如何做到这一点吗?任何帮助将非常感激。

答案1

小编典典

您可以使用wordsNLTK的语料库:

import nltkwords = set(nltk.corpus.words.words())sent = "Io andiamo to the beach with my amico."" ".join(w for w in nltk.wordpunct_tokenize(sent) \         if w.lower() in words or not w.isalpha())# ''Io to the beach with my''

不幸的是, 艾奥 恰好是一个英语单词。通常,可能很难确定一个单词是否为英语。

python从文本中提取某酒店机顶盒号和智能卡号

python从文本中提取某酒店机顶盒号和智能卡号

1、某项目中经常遇到需要关闭一些机顶盒消费权限。但是给过来的不是纯字符串,需要自己提取。

 

有400多个机顶盒和智能卡。nodepad++的列块模式也可以提取,但是还是稍微麻烦,因为列不对等

先复制到文本里

 

提取脚本,使用re模块,它功能更强大。

[\n:-]+表示以里面的多种为分隔符

#正则表达式[,|;*]中的任何一个出现至少一次

import re
f=open(''1.txt'',''r'',encoding=''utf-8'')
w=open(''2.txt'',''a'',encoding=''utf-8'')
while True:
    if len(f.readline())<10:
        break
    line=f.readline()
    list1=re.split(''[\n:-]+'',line)
    print(list1)
    w.write(list1[3]+''\n'')
    w.write(list1[5]+''\n'')

  

 只需要取每行列表的第三个和第五个即可

 

 写入到新文本的显示

 

python从文本文件到数组传输

python从文本文件到数组传输

如何解决python从文本文件到数组传输?

我有一个类似的文本文件:

[0.001,0.02,0.003]
[0.004,0.05,0.006]

我想制作一个这样的数组:

array([0.001,0.003],[0.004,0.006]) etc.

所有元素都是浮动的。

我该怎么做?谢谢。

解决方法

这是一种方法

#First open the text file and turn each line into an element of a list.

with open("file.txt",''r'') as file_handle:
    # convert file contents into a list
    lines = file_handle.read().splitlines()

#Then convert the string into a list

for i in range(len(lines)):
    #remove the "[" and "]" and split where there is a ","
    lines[i] = lines[i].strip("[]").split(",")
    for j in range(len(lines[i])):
        #convert string to float
        lines[i][j] = float(lines[i][j])

print(lines)

python常用英语单词(初学,英语不好的适用)

python常用英语单词(初学,英语不好的适用)

这是关尓佟从网上收集到的一些python常用单词,对于英语不好的及一些初学者比较适用,同时这些编程单词也是浓缩过的,(少了不怕后续发文再补)。

 

对于刚才是学习python这些也足够了,一天学个六七个单词记一下在配合自己寻找的视频、书籍等等方法去学习是有一定帮助的。

 

这里关尓佟还是要说一句,关尓佟博客提供的是非专业人士内容,仅供兴趣爱好学习使用,个人开发者(非考虑未来靠此为生的人士)我们一起学习,一起成长。

下列常用单词大家可以复制一下,自己用Word排版一下。

 

Python常用英文单词:

一、交互式环境与print输出

1、print:打印/输出
2、coding:编码
3、syntax:语法
4、error:错误
5、invalid:无效
6、identifier:名称/标识符
7、character :字符

 

二、字符串的操作

 

1、user:用户

2、name:姓名/名称

3、attribute:字段/属性

4、value:值

5、key:键

 

三、重复/转换/替换/原始字符串

1、upper:上面
2、lower:下面
3、capitalize:用大写字母写或印刷
4、title:标题
5、replace:替换
6、old:旧的
7、new:新的
8、count:计数
9、swap:互换
10、case:情形
11、path:路径
12、new:新的新建
13、project:项目
14、test:测试
15、file:文件
16、data:数据

 

 

四、去除/查询/计数

1、strip:去除
2、index:索引
3、find:查找
4、count:计数
5、start:开始
6、end:结束
7、chars:字符
8、sub:附属

五、获取输入/格式化

1、input:输入
2、prompt:提示
3、ID:身份证
4、format:格式化
5、args(argument):参数
6、kwargs:关键字参数
7、year:年
8、month:月
9、day:日

六、元组

1、tuple:元组
2、max:最大
3、min:最小
4、iterable:可迭代
5、key:关键字
6、function:方法/函数
7、stop:停止
8、object:对象

七、列表

1、list:列表
2、reverse:反向
3、true:真
4、false:假
5、append:附加
6、extend:扩展
7、insert:插入
8、pop:取出
9、remove:移除
10、del(delete):删除
11、clear:清除
12、sort:排序

八、集合

1、set:集合/设置
2、add:添加
3、update:更新
4、discard:丢弃
5、intersection:相交
6、union:联合
7、difference:差数
8、symmetric:对称
9、in:在…里面
10、not:不/不是
11、disjoint:不相交
12、subset:子集
13、superset:父集/超集
14、copy:复制

九、字典

1、dict:字典
2、key:键/关键字
3、value:值
4、item:项
5、mapping:映射
6、seq(sequence):序列
7、from:从/来自
8、get:获取
9、default:默认
10、none:没有
11、arg:可变元素
12、kwargs(keyword args):可变关键字元素

十、循环

1、for…in…循环的使用
2、while…循环的使用
3、range:范围
4、sep(separate):分隔
5、flush:冲刷
6、step:步长
7、continue:继续
8、break:突破/跳出

十一、条件/跳出与结束循环

1、if:如果
2、else:否则

十二、运算符与随机数

1、module:模块
2、sys(system):系统
3、path:路径
4、import:导入
5、from:从…

 

十三、定义函数与设定参数

1、birthday:出生日期
2、year:年份
3、month:月份
4、day:日期
5、type:类型
6、error:错误
7、missing:丢失
8、required:必须
9、positional:位置
10、unsupported:不支持

十四、设定收集参数

1、create:创建
2、info:信息
3、age:年龄
4、height:高度
5、width:宽度
6、weight:重量
7、splicing:拼接
8、params:参数
9、volume:体积
11、operand:操作数

十五、嵌套函数/作用域/闭包

1、inside:内部
2、outside:外部
3、radius:半径
4、perimeter:周长
5、case:情形
6、synthesis:合成
7、execute:执行

十六、递归函数

1、recursion:递归
2、Infinite:无穷
3、maximum:最大值
4、depth:深度
5、exceeded:超过
6、factorial:阶乘
7、search:查询
8、power:幂
9、lower:下方
10、upper:上方
11、middle:中间
12、assert/assertion:异常

十七、列表推导式/lambda表达式

1、square:平方
2、even:偶数
3、comprehension:理解
4、lambda:希腊字母λ的英文名称,大名鼎鼎的游戏半条命里面的logo就是这个。

十八、列表推导式/lambda表达式

1、regular:规则
2、expression: 表达式
3、group:组
4、match:匹配
5、span:跨度
6、ignore case:忽略 大小写
7、multi line:多 行
8、dot all:点 全部
9、unicode:万国码
10、verbose:累赘
11、pos/position:位置

本文来自:关尓佟博客,原地址:https://guanertong.cn/post/23...

python英语单词测试小程序

python英语单词测试小程序

博主爬取了扇贝英语网,并制作了一个英语单词测试的小程序,还能生成错词本,一起来看下代码吧~

import requests

#扇贝网爬虫,获取英语单词
category_res=requests.get(‘https://www.shanbay.com/api/v1/vocabtest/category/?_=1566889802182‘)
category_json=category_res.json()
category_data=category_json[‘data‘]

#选择出题范围
for i in range(10):
    print(str(i+1)+‘.‘+category_data[i][1])
number=int(input(‘请选择出题范围:‘))

url=‘https://www.shanbay.com/api/v1/vocabtest/vocabularies/‘
headers={
    ‘Referer‘: ‘https://www.shanbay.com/vocabtest/‘,‘User-Agent‘: ‘Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_4) AppleWebKit/605.1.15 (KHTML,like Gecko) Version/12.1 Safari/605.1.15‘
    }
params={
    ‘category‘:category_data[number-1][0],‘_‘: ‘1566889452889‘
    }

res=requests.get(url,headers=headers,params=params)
jsonres=res.json()

vacabularies=jsonres[‘data‘]
kNows=[]
unkNows=[]
print()
print(‘以下单词你是否认识?‘)
n=0
z=0

b=open(‘错词本.txt‘,‘a+‘)
b.write(‘你不认识的单词有:\n‘)

#测试开始,挑选认识的单词
for vacabulary in vacabularies:
    n=n+1
    vacabu=vacabulary[‘content‘]
    print(‘第‘+str(n)+‘个:‘+vacabu)
    index=vacabularies.index(vacabulary)

    while True:
        judge=input(‘认识选Y,不认识选N:‘)
        if judge==‘Y‘:
            kNows.append(index)
            break
        elif judge==‘N‘:
            unkNows.append(index)
            z=z+1
            b.write(str(z)+‘.‘+vacabu+‘\n‘)
            break
        else:
            print(‘请输入Y或者N‘)
print()           
print(‘测试结束,以下是测试结果:‘)
print(‘认识‘+str(len(kNows))+‘个单词,不认识‘+str(len(unkNows))+‘个单词。‘)
print(‘你可真棒!‘)
print()

right=[]
wrong=[]

#选择正确的词义
b.write(‘你记错的单词有:\n‘)
m=0
for kNow in kNows:
    vacabulary_kNow=vacabularies[kNow]
    word=vacabulary_kNow[‘content‘]
    print()
    print(word)

    deFinitions=vacabulary_kNow[‘deFinition_choices‘]

    for i in range(4):
        print(str(i+1)+‘.‘+deFinitions[i][‘deFinition‘])
    choice=int(input(‘单词测试,请选择正确的词义:‘))
    rank=deFinitions[choice-1][‘rank‘]
    if rank==vacabulary_kNow[‘rank‘]:
        right.append(word)
    else:
        wrong.append(word)
        m=m+1
        b.write(str(m)+‘.‘+word+‘\n‘)

print()
print(‘测试结果出来啦!‘)

print(‘认识的单词里掌握了这几个:‘)
print(right)
print()
print(‘没掌握的是这几个:‘)
print(wrong)

我们今天的关于使用Python从文本中删除非英语单词python删除非字母的分享就到这里,谢谢您的阅读,如果想了解更多关于python从文本中提取某酒店机顶盒号和智能卡号、python从文本文件到数组传输、python常用英语单词(初学,英语不好的适用)、python英语单词测试小程序的相关信息,可以在本站进行搜索。

本文标签: