Blog
  • 首页
  • 归档
  • 分类
  • 标签
  • 关于
文本预处理

文本预处理

文本可以认为是一个时间序列,对于文本中的每个字或者词都可以认为是一个向量,这些向量之间有先后顺序关系。 对于一个文本序列,我们可以进行字符级语言建模或者词级语言建模:字级建模就是将每个字当成一个时间步的数据,比如“我要学习英语”,字符级语言建模会将其拆分为“我”、“要”、“学”、“习”、“英”、“语”;词级语言建模会将文本拆分成一个一个的词语,以此为最小单位作为每个时间步的数据,比如“我要学英语”
2025-03-30
深度学习 > PyTorch
#人工智能 #神经网络 #深度学习 #PyTorch
循环神经网络(RNN)

循环神经网络(RNN)

循环神经网络的引入 循环神经网络(RNN)本质上就是一个隐变量自回归模型(latent autoregressive models),循环神经网络通过引入时间维度的循环连接,使网络具备记忆能力。其核心结构包括输入层、隐层和输出层,隐层的输出不仅传递给当前时刻的输出层,还会传递给下一时刻的隐层,形成时间展开的动态结构。 RNN 可以认为\(\mathbf{H}_t\)中就存储了之前时刻输入的
2025-03-30
深度学习 > 理论基础
#人工智能 #神经网络 #深度学习
环境变量

环境变量

什么是环境变量 环境变量是系统或者用户级别的动态值,用于定义程序运行时的环境信息(如路径、语言等)。 查看环境变量 printenv:列出所有环境变量 printenv 变量名:查看指定变量值,如printenv PATH echo $变量名:查看指定变量值,如echo $PATH env或set:显示所有变量(包括局部变量和函数) 常见的环境变量 PATH 作用:定义可执行文件的所搜路径,系
2025-03-19
Linux > Ubuntu
#Linux #Ubuntu #服务器 #后端 #自定义命令
pymysql Python与数据库的连接

pymysql Python与数据库的连接

简介 pymysql提供了Python与MySQL数据库进行交互的API,我们可以使用pymysql对数据库进行读写操作 安装 1pip install pymysql 使用 连接数据库 使用pymysql.connect()函数建立与数据库的连接: 12345678910import pymysqldb = pymysql.connect( host='localhost
2025-03-17
编程 > Python > 数据库
#编程 #Python #自动化 #数据库
Selenium的一些经验

Selenium的一些经验

元素不可见 如图,想要控制selenium在该输入框内输入路径,但是点击该输入框在该文件管理器非全屏的情况下会触发点击的是个人空间箭头的情况: 也就是并没有找到真正的输入框,但是通过控制台选择元素的方式无法找到真正的输入框,那么很可能是因为输入框被隐藏了,只有在手动点击后才会显示出来。 点击输入框后: 如果Selenium直接选择该输入框,由于该输入框不可见,无法点击,也无法输入内容,因此
2025-03-17
编程 > Python > 网络爬虫
#编程 #Python #自动化 #爬虫
Python爬虫

Python爬虫

获取数据 requests库 requests库为第三方库,Python不内置,需要手动安装: 1pip install requests 或 1pip3 install requests GET请求 如果要向网页发送GET请求,使用requests库中的get方法: 123import requestshttp = requests.get('http://httpbin.org/ge
2025-03-17
编程 > Python > 网络爬虫
#编程 #Python #自动化 #爬虫
SMTP发送邮件

SMTP发送邮件

使用smtplib、email发送邮件 smtplib库是python自带的库,专门用于发送邮件。使用smtplib,我们可以通过SMTP协议与邮件服务器进行通信,从而发送邮件。 email库也是python自带的库,提供了构造和解析电子邮件消息的API,我们可以用它来创建包含文本、HTML、附件等内容的复杂邮件消息,也可以解析来自文件、字符串或网络的邮件消息 smtplib的使用 导入smtpl
2025-03-17
编程 > Python > 邮件
#编程 #Python #自动化
Batch Normalization

Batch Normalization

未经过(批量)归一化的多层神经网络会出现什么问题 Internal Covariate Shift Internal Covariate Shift,简称ICS,中文名为内部协变量偏移。 我们先来看一组神经网络: 神经网络 其中,第一层为输入层,最后一层为输出层,其余为隐藏层: 神经网络 隐藏层1接收的是输入层的数据,隐藏层2接收的是隐藏层1的数据,隐藏层3接收的是隐藏层2的数据,输出
2025-03-15
深度学习 > 理论基础
#人工智能 #神经网络 #深度学习
DenseNet

DenseNet

介绍 DenseNet,全称为Densely Connected Convolutional Networks,即密集连接卷积网络,是一种深度卷积神经网络模型。它由Gao Huang等人于2017年提出,旨在改善神经网络中的信息流动和梯度的传播。 原理 DenseNet的主要特点是其“密集连接”机制,即每一层的输入是前面所有层输出的并集,而其输出又被直接传递给后面所有层作为输入。这种连接方式使得网
2025-03-15
深度学习 > 理论基础
#人工智能 #神经网络 #深度学习
Dropout

Dropout

什么是Dropout Dropout方法,中文名称为丢弃法、暂退法。顾名思义,这个方法会选择丢弃一部分的神经元,从而达到减轻过拟合的目的。 Dropout一般用于全连接层部分。 Dropout为什么能缓解过拟合 Dropout是一种常用的深度学习正则化技术,可以有效缓解过拟合问题。其基本思想是在训练过程中随机地“丢弃”(即暂时移除)神经网络中的一部分单元(神经元),以减少模型对特定神经元的依赖,从
2025-03-15
深度学习 > 理论基础
#人工智能 #神经网络 #深度学习
12345…7

搜索

What doesn't kill you makes you stronger.