神经网络基础:从感知机到深度学习
1 分钟阅读
什么是神经网络?
神经网络是一种模仿生物神经系统的计算模型。它由大量互联的节点(神经元)组成,每个节点接收输入、进行计算并产生输出。
感知机
感知机是最简单的神经网络形式,由一个神经元组成:
def perceptron(x, w, b):
activation = sum(xi * wi for xi, wi in zip(x, w)) + b
return 1 if activation > 0 else 0
多层神经网络
实际应用中,我们使用多层结构:
- 输入层 - 接收原始数据
- 隐藏层 - 提取特征
- 输出层 - 给出预测结果
反向传播
反向传播是训练神经网络的核心算法,通过计算损失函数对每个权重的梯度来更新参数。
for epoch in range(epochs):
# 前向传播
output = model(X)
loss = criterion(output, y)
# 反向传播
loss.backward()
optimizer.step()
总结
神经网络是深度学习的基础,理解其原理对后续学习至关重要。