百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

Python启航:30天编程速成之旅(第24天)- 实用程序片段

wptr33 2025-03-29 23:05 9 浏览

喜欢的条友记得关注、点赞、转发、收藏,你们的支持就是我最大的动力源泉。

前期基础教程:

「Python3.11.0」手把手教你安装最新版Python运行环境

讲讲Python环境使用Pip命令快速下载各类库的方法

Python启航:30天编程速成之旅(第2天)-IDE安装

【Python教程】JupyterLab 开发环境安装


Python启航:30天编程速成之旅(第24天)- 实用程序片段

使用Python提取中文字符和中文标点符号

在这个教程中,我们将学习如何使用Python从字符串中提取中文字符和中文标点符号。我们将使用正则表达式库 re 来完成这个任务。以下是完整的代码示例,并附有详细注释和解释。

1. 导入re库

首先,我们需要导入 Python 的正则表达式库 re。这个库提供了强大的功能来处理字符串中的模式匹配。

import re

2. 定义函数
extract_chinese_and_punctuation

我们定义一个名为
extract_chinese_and_punctuation 的函数,该函数接受一个字符串参数 text,并返回一个新的字符串,其中只包含中文字符和中文标点符号。

def extract_chinese_and_punctuation(text):

3. 创建正则表达式模式combined_pattern

接下来,我们创建一个正则表达式模式 combined_pattern,用于匹配中文字符和常见的中文标点符号。

  • 中文字符范围: \u4e00-\u9fff中文字符的 Unicode 编码范围是从 \u4e00 到 \u9fff。
  • 常见中文标点符号:逗号:, (U+FF0C)句号:。 (U+3002)感叹号:! (U+FF01)问号:? (U+FF1F)分号:; (U+FF1B)冒号:: (U+FF1A)引号:“”‘’ (U+201C, U+201D, U+2018, U+2019)圆括号:() (U+FF08, U+FF09)方括号:【】 (U+3010, U+3011)角括号:《》 (U+300A, U+300B)顿号:、 (U+3001)

将这些字符合并到一个字符类中:

    combined_pattern = r'[\u4e00-\u9fff,。!?;:“”‘’()【】《》、]'

4. 使用re.findall查找所有匹配的字符

我们使用 re.findall 函数来查找所有符合 combined_pattern 的字符。re.findall 返回一个列表,其中包含所有匹配的子串。

    result = ''.join(re.findall(combined_pattern, text))
  • re.findall(pattern, string):在字符串 string 中查找所有与 pattern 匹配的子串,并返回一个列表。
  • ''.join(...):将列表中的所有元素连接成一个字符串。

5. 返回结果

最后,我们返回处理后的字符串 result。

    return result

6. 示例用法

我们提供一个示例字符串 text,并调用
extract_chinese_and_punctuation 函数来提取其中的中文字符和中文标点符号。

# 示例字符串
text = "Hello, 你好!This is a test. 这是一个测试。"
result = extract_chinese_and_punctuation(text)
print(result)  # 输出: 你好!这是一个测试。

7.完整代码

import re

def extract_chinese_and_punctuation(text):
    # 中文字符和常见中文标点符号的范围
    combined_pattern = r'[\u4e00-\u9fff,。!?;:“”‘’()【】《》、]'
    
    # 查找所有匹配的字符
    result = ''.join(re.findall(combined_pattern, text))
    return result

# 示例字符串
text = "Hello, 你好!This is a test. 这是一个测试。"
result = extract_chinese_and_punctuation(text)
print(result)

运行结果

使用Python将长文本按指定长度分段

在这个教程中,我们将学习如何使用Python将长文本按指定的长度分段。我们将编写一个函数 split_text,该函数接受一个字符串和一个整数参数,并返回一个包含多个子字符串的列表,每个子字符串的长度不超过指定的长度。

详细步骤解析

1. 定义函数split_text

我们定义一个名为 split_text 的函数,该函数接受两个参数:

  • text: 要分割的长文本。
  • length: 每个子字符串的最大长度,默认值为20。
def split_text(text, length=20):
    """将长文本按指定长度分段"""

2. 使用列表推导式进行分段

在函数内部,我们使用列表推导式来生成一个包含多个子字符串的列表。每个子字符串的长度不超过指定的 length。

    return [text[i:i+length] for i in range(0, len(text), length)]

解释列表推导式

  • range(0, len(text), length): 生成一个从0开始到 len(text) 结束的序列,步长为 length。例如,如果 text 的长度为50,length 为20,则生成的序列为 [0, 20, 40]。
  • text[i:i+length]: 从 text 中切片,从索引 i 开始,到索引 i+length 结束(不包括 i+length)。例如,当 i 为0时,切片为 text[0:20];当 i 为20时,切片为 text[20:40]。
  • [...]: 将所有切片结果收集到一个列表中。

3. 示例用法

我们提供一个示例字符串 text,并调用 split_text 函数来将其按指定长度分段。

text = "通过本教程,你已经学会了如何使用Python的正则表达式库 re 来提取字符串\
    中的中文字符和中文标点符号。这种方法不仅高效,而且易于理解。希望这个教程对你有所帮助!"

print(split_text(text))

输出结果

运行上述代码后,输出将是:

['通过本教程,你已经学会', '了如何使用Python的正则表', '达式库 re 来提取字', '符串中的中文字符', '和中文标点符号。这种方', '法不仅高效,而且易', '于理解。希望这个教', '程对你有所帮助!']

每个子字符串的长度不超过20个字符。

4.完整代码

def split_text(text, length=20):
    """将长文本按指定长度分段"""
    return [text[i:i+length] for i in range(0, len(text), length)]

text = "通过本教程,你已经学会了如何使用Python的正则表达式库 re 来提取字符串\
    中的中文字符和中文标点符号。这种方法不仅高效,而且易于理解。希望这个教程对你有所帮助!"

print(split_text(text))

运行结果

使用Python根据出生日期计算年龄

在这个教程中,我们将学习如何使用Python根据出生日期计算一个人的年龄。我们将编写一个函数 calculate_age,该函数接受一个字符串形式的出生日期,并返回相应的年龄。

详细步骤解析

1. 导入datetime模块

首先,我们需要导入 Python 的 datetime 模块。这个模块提供了处理日期和时间的功能。

from datetime import datetime

2. 定义函数calculate_age

我们定义一个名为 calculate_age 的函数,该函数接受一个参数:

  • birth_date: 字符串形式的出生日期,格式为 'YYYY-MM-DD'。
def calculate_age(birth_date):
    """根据出生日期计算年龄"""

3. 获取当前日期

使用 datetime.now() 方法获取当前的日期和时间。

    today = datetime.now()

解释

  • datetime.now(): 返回当前的本地日期和时间。

4. 将出生日期字符串转换为datetime对象

使用 datetime.strptime 方法将字符串形式的出生日期转换为 datetime 对象。

    birth = datetime.strptime(birth_date, '%Y-%m-%d')

解释

  • datetime.strptime(date_string, format): 根据指定的格式将字符串解析为 datetime 对象。
  • '%Y-%m-%d': 表示日期格式为四位数的年份、两位数的月份和两位数的日期,例如 '1979-03-26'。

5. 计算初步年龄

通过减去出生年份和当前年份来计算初步的年龄。

    age = today.year - birth.year

解释

  • today.year: 当前年的年份。
  • birth.year: 出生年的年份。
  • age = today.year - birth.year: 初步计算年龄,假设今天已经是生日过了。

6. 调整年龄以考虑月份和日期

如果当前月份小于出生月份,或者当前月份等于出生月份但当前日期小于出生日期,则需要将年龄减一。

    if today.month < birth.month or (today.month == birth.month and today.day < birth.day):
        age -= 1

解释

  • today.month < birth.month: 如果当前月份小于出生月份。
  • today.month == birth.month and today.day < birth.day: 如果当前月份等于出生月份且当前日期小于出生日期。
  • age -= 1: 如果上述条件之一为真,则年龄减一。

7. 返回计算得到的年龄

最后,返回计算得到的年龄。

    return age

8. 示例用法

我们提供一个示例出生日期 '1979-03-26',并调用 calculate_age 函数来计算相应的年龄。

print(calculate_age('1980-01-01'))

输出结果

运行上述代码后,输出将是当前日期对应的年龄。例如,如果当前日期是2024年12月10日,则输出可能是:

44

9.完整代码

from datetime import datetime

def calculate_age(birth_date):
    """根据出生日期计算年龄"""
    today = datetime.now()
    birth = datetime.strptime(birth_date, '%Y-%m-%d')
    age = today.year - birth.year
    if today.month < birth.month or (today.month == birth.month and today.day < birth.day):
        age -= 1
    return age

print(calculate_age('1980-01-01'))

运行结果

喜欢的条友记得关注、点赞、转发、收藏,你们的支持就是我最大的动力源泉。

相关推荐

每天一个AI姬,AMD核显用户有福了,AI绘画打破 NVIDIA 显卡垄断

使用StableDiffusion进行AI绘画,并不一定只能使用NVIDIA英伟达显卡,甚至,也不一定只能使用独立显卡。今天我们使用AMD6800H核显,并安装了StableDif...

NETworkManager:功能强大的网络管理与问题排除工具

关于NETworkManagerNETworkManager是一款功能强大的网络管理与问题排除工具,该工具完全开源,可以帮助广大研究人员轻松管理目标网络系统并排除网络疑难问题。该工具使用远程桌面、Po...

AMD也能深度学习+免费AI绘画:StableDiffusion+ROCm部署教程!

某国政客扇扇嘴皮子,CN玩硬件和深度学习的圈子里就掀起了一场风暴,这就是著名的嘴皮子效应(误)。没了高性能计算的A100H100倒也能理解,但是美利坚这波把RTX4090禁售了就让人无语了,所以不少做...

windows 下编译 python_rtmpstream

最近在研究数字人,看了大咖的项目(https://github.com/lipku/metahuman-stream),尝试编译此项目的依赖项目python_rtmpstream(https://gi...

如何使用 Python 操作 Git 代码?GitPython 入门介绍

花下猫语:今天,我在查阅如何用Python操作Gitlab的时候,看到这篇文章,觉得还不错,特分享给大家。文中还提到了其它几种操作Git的方法,后续有机会的话,再陆续分享之~~作者:匿蟒...

网上看了不少,终于把ZlmediaKit流媒体框架搭建起来啦

你都站在2023年代了,视频通话、视频直播、视频会议、视频监控就是风口浪尖上的猪师兄,只要你学那么一丁点,拿个高薪的工作不过分吧!我也是半瓶子晃荡的,所以路人呀,共学习,同进步!本篇开始,只讲在Lin...

MacDown:一款 macOS 的强大 Markdown 编辑器

大家好,很高兴又见面了,我是"...

ZLMediaKit安装配置和推拉流

一、ZLMediaKit库简介ZLMediaKit是一个基于...

大神赞过的:学习 WebAssembly 汇编语言程序设计

文/阿里淘系F(x)Team-旭伦随着前端页面变得越来越复杂,javascript的性能问题一再被诟病。而Javascript设计时就不是为了性能优化设计的,这使得浏览器上可以运行的本地语言一...

【Docker】部署WVP视频监控平台

回来Docker系列,今天将会跟大家分享一则关于开源WVP视频监控平台的搭建。先说结论吧,一开始按照网上说的一步一步搭建没有搭建成功,不知道是版本太旧还是我这边机器有问题,尝试了好几个不同方式的搭建都...

MongoDB+GridFS存储文件方案

GridFS是MongoDB的一个内置功能,它提供一组文件操作的API以利用MongoDB存储文件,GridFS的基本原理是将文件保存在两个Collection中,一个保存文件索引,一个保存文...

【开源】强大、创新且直观的 EDA套件

今天分享的LibrePCB是...

Ollama如何制作自己的大模型?

背景Llama3发布了,这次用了...

Ollama使用指南【超全版】

一、Ollama快速入门Ollama是一个用于在本地运行大型语言模型的工具,下面将介绍如何在不同操作系统上安装和使用Ollama。官网:https://ollama.comGithub:http...

基于区块链的价值共享互联网即时通讯应用平台源码免费分享

——————关注转发之后私信回复【源码】即可免费获取到本项目所有源码基于区块链的价值共享互联网即时通讯应用平台,是一个去中心化的任何人都可以使用的通讯网络,是一款基于区块链的价值共享互联网即时通讯AP...