网学网其他类别编辑为广大网友搜集整理了:Python中的文本处理绩等信息,祝愿广大网友取得需要的信息,参考学习。
与其它几种流行的脚本语言一样,Python 是一种用于浏览和处理文本数据的优秀工具。本文为 Python 的初学者概述了 Python 的文本处理工具。文章说明了规则表达式的一些常规概念,并提供了处理文本时,什么情况下应使用(或不使用)规则表达式的建议。
什么是 Python?Python 是由 Guido van Rossum 开发的、可免费获得的、非常高级的解释型语言。其语法简单易懂,而其面向对象的语义功能强大(但又灵活)。Python 可以广泛使用并具有高度的可移植性。字符串 -- 不可改变的序列如同大多数高级编程语言一样,变长字符串是 Python 中的基本类型。Python 在“后台”分配内存以保存字符串(或其它值),程序员不必为此操心。Python 还有一些其它高级语言没有的字符串处理功能。在 Python 中,字符串是“不可改变的序列”。尽管不能“按位置”修改字符串(如字节组),但程序可以引用字符串的元素或子序列,就象使用任何序列一样。Python 使用灵活的“分片”操作来引用子序列,字符片段的格式类似于电子表格中一定范围的行或列。以下交互式会话说明了字符串和字符片段的的用法:字符串和分片>>> s = "mary had a little lamb">>> s[0] # index is zero-based 'm'>>> s = 'x' # changing element in-place failsTraceback (innermost last):File "<stdin>", line 1, in ?TypeError: object doesn't support item assignment>>> s[11:18] # 'slice' a subsequence 'little '>>> s[:4] # empty slice-begin assumes zero 'mary'>>> s # index 4 is not included in slice [:4] ' '>>> s[5:-5] # can use "from end" index with negatives 'had a little'>>> s[:5]+s[5:] # slice-begin & slice-end are complimentary 'mary had a little lamb'