Python 入门第一课:从 Hello World 到智能交互
Python 入门第一课:从 Hello World 到智能交互大家好!这是我学习 Python 的第一篇笔记。很多新手在面对第一行代码时都会迷茫:“我该从哪里开始?这些概念之间有什么关系?” 今天,我将通过一个连贯的学习路径,带大家从零开始,完成一个能与人互动的 Python 小程序。我们将经历:输出信息 -> 存储数据 -> 做出判断 -> 处理意外 -> 优雅赋值 的全过程。 第一步:向世界打招呼一切的开始,都是让计算机说出第一句话。在 Python 中,这只需要一行代码: ```pythonprint(“hello world”) 💡 心得:print() 是我们与计算机沟通的最基本方式,就像我们开口说话一样。第二步:给数据找个“家”(变量与类型)程序需要处理各种信息。在 Python 中,我们用变量来存储这些数据。Python 很聪明,它能自动识别数据的类型:python 编辑 字符串:人的名字student_name = “查理” 整数:年龄student_age = 20 浮点数:成绩(带小数)gpa = 3.75 布尔值:状态(只有真或假)is ...
从零开始搭建 Hexo 博客(三):GitHub Pages 部署与 Token 认证详解
从零开始搭建 Hexo 博客(三):GitHub Pages 部署与 Token 认证详解上一篇我们完成了 Butterfly 主题配置(第二篇),现在进入关键一步:将本地博客推送到 GitHub Pages,让全世界都能访问!前提条件:你已按第一篇注册 GitHub 账号(如 hyrx-tg),且博客项目位于 D:\Blog\my-blog。 一、创建 GitHub Pages 仓库(必须按此步骤)1. 登录 GitHub → 点击右上角 + → New repository2. 仓库名必须为:你的用户名.github.io(如 hyrx-tg.github.io) ✅ 正确示例:hyrx-tg.github.io ❌ 错误示例:my-blog、hexo-blog3. 选择 Public → 不要勾选 Initialize this repository with a README4. 点击 Create repository ⚠️ 重要:仓库名必须是 用户名.github.io,否则无法访问! 二、配置 Hexo 部署(基于第二篇的项目)1. 安装部署插件(如果未安装)` ...
从零开始搭建 Hexo 博客(二):配置 Butterfly 主题与基础美化
从零开始搭建 Hexo 博客(二):配置 Butterfly 主题与基础美化上一篇我们完成了 Hexo 环境搭建(Git + Node.js + GitHub 账号)和 项目初始化(hexo init my-blog),现在开始让博客 变得好看!关键前提:你已按第一篇操作,博客项目位于 D:\Blog\my-blog。 一、安装 Butterfly 主题(从初始化目录开始)1. 进入博客根目录(必须!) 你刚在第一篇创建的项目路径:D:\Blog\my-blog ```bash 打开 Git Bash 或 CMD,执行:cd D:\Blog\my-blog 💡 如果路径有中文或空格,必须用双引号:cd “D:\Blog\my-blog”2. 克隆 Butterfly 主题从 GitHub 下载最新主题(官方推荐)bash 编辑 git clone -b master https://github.com/jerryc127/hexo-theme-butterfly.git themes/butterfly✅ 执行成功后,目录结构:文本 编辑 my-blog/├── themes/ ...
从零开始搭建 Hexo 博客(一):环境准备与 Hexo 初始化
从零开始搭建 Hexo 博客(一):环境准备与 Hexo 初始化想拥有一个免费、快速、高颜值的个人博客?Hexo + GitHub Pages 是最佳选择!本系列将手把手教你从零搭建,即使你是编程小白也能成功。今天是第一篇:安装必备软件并初始化 Hexo 项目。 一、安装三大核心工具1. 安装 Git(版本控制) 作用:用于将本地博客推送到 GitHub。 下载地址:https://git-scm.com/download/win 安装步骤: 双击下载好的安装包(如 Git-2.xx.x-64-bit.exe) 全程点击 “Next” 关键一步:当看到 “Choosing the default editor used by Git” 时,下拉菜单选择:1Use Notepad as Git's default editor (这对新手最友好,避免进入复杂的 Vim 编辑器) 继续点击 “Next”,直到 “Install” 完成。 验证是否安装成功:按 Win + R,输入 cmd 回车,打开命令提示符,运行: 1git --version 如果显示类似 git ...
欢迎来到我的博客
我的第一篇技术笔记
我的第一篇技术笔记:从零搭建 Hexo 博客一、前期准备:装 3 个必备软件(按顺序来)1. 装 Git(版本控制工具,必须装)下载打开浏览器,访问:https://git-scm.com/download/win点击页面中间的 “Click here to download”,自动下载 Windows 版安装包。 安装(全程无脑点 “Next”,只有 1 个地方注意) 双击下载好的安装包(文件名类似 Git-2.45.0-64-bit.exe)。 一路点 Next,直到看到 “Choosing the default editor” 这一步: 下拉菜单选 “Use Notepad as Git’s default editor”(用记事本当默认编辑器,小白最友好)。 继续一路点 Next,最后点 Install 安装,安装完成后点 Finish。 验证安装成功按 Win + R 键,输入 cmd 回车,打开黑色命令行窗口,输入: ```bashgit –version
机器学习(NLP文本分类)标准项目流程与实战笔记
机器学习(NLP文本分类)标准项目流程第一阶段:环境搭建与数据工程依赖库导入与环境配置:加载数据处理(Pandas)、自然语言处理(Jieba)、机器学习框架(Scikit-learn)等必要的第三方库,并配置系统参数(如忽略警告、设置日志级别)以优化运行环境。数据收集与加载:获取原始语料库,构建结构化的数据集(如DataFrame),明确样本数据(Text)与对应的真实标签(Label/Ground Truth)。第二阶段:特征工程3. 文本预处理与清洗:针对非结构化的文本数据进行规范化处理。包括统一大小写、去除特殊符号等,以降低数据噪声。4. 中文分词:由于中文语义的连续性,需调用专用分词工具(如Jieba)将连续的文本序列切分为独立的词汇单元,为后续的特征提取奠定基础。5. 特征向量化:将处理后的文本数据转化为计算机可计算的数值型矩阵。通过特征提取算法(如TF-IDF)构建特征空间,生成特征矩阵(X)与标签向量(y),完成从“自然语言”到“机器语言”的映射。第三阶段:模型构建与训练6. 数据集划分:采用随机抽样方法,将整体数据集按比例(如8:2)划分为训练集(用于模型学习)和测试 ...
NLP文本特征提取:词袋模型BOW与TF-IDF原理实战详解 -w3
本章为AI算法自然语言处理入门实战,重点学习文本数字化核心方案:词袋模型(BOW)与 TF-IDF 权重算法。结合课堂代码运行结果,深度拆解矩阵输出规则、权重计算逻辑,解决新手常见理解误区,夯实NLP基础。 📑 一、学习前言计算机无法直接识别汉字、文本等非结构化数据,想要让模型处理文本、做分类、相似度计算、情感分析,第一步必须将文本转为数字向量。本节课学习两种最经典的文本向量化方式: 词袋模型 BOW:基于单词计数的简单文本特征提取 TF-IDF:结合词频与全局权重的进阶文本特征提取,工业级常用方案 💻 二、课堂完整实战代码123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657# 导入需要的库# pandas:数据处理工具(本次辅助使用)import pandas as pd# CountVectorizer:实现词袋模型,统计单词出现次数# TfidfVectorizer:实现TF-IDF算法,计算单词重要性权重f ...
机器学习实战复盘:线性回归作业与5个新手避坑指南 -w2
本篇通过加州房价预测线性回归作业,复盘新手最容易踩的5个典型坑:回归任务误用分层抽样、评估指标传参错误、变量逻辑顺序颠倒、占位符未替换、特征标准化流程混乱。犯错是最好的学习,这篇帮你把弯路走直。 💻 一、作业完整代码(修正后最终版)12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273import pandas as pdimport numpy as npimport matplotlibmatplotlib.use('Agg') # 设置非交互式后端import matplotlib.pyplot as pltfrom sklearn.datasets import fetch_california_housingfrom sklearn.model_selection import train_test_splitfrom sklea ...
机器学习实战:不平衡数据集与准确率陷阱 -w2
真实场景中,数据集99%都是不平衡的(欺诈检测、疾病诊断、故障检测)。本篇带你认识:准确率的巨大陷阱、混淆矩阵、精确率、召回率、F1分数,学会正确评估分类模型。 🎯 一、本篇核心目标 理解数据不平衡是什么(正负比例 1:19) 看清准确率(Accuracy)的陷阱 学会使用混淆矩阵、精确率、召回率、F1正确评估模型 掌握 stratify=y 分层抽样的重要性 学会生成模拟不平衡数据 💻 二、完整代码(详细注释版)123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263# 不平衡数据集实战# 重点:准确率不能信!必须看精确率、召回率、F1# ======================# 1. 导入库# ======================from sklearn.datasets import make_classificationfrom sklearn.model_selection ...
avatar
HYRX-TG
运维工程师 | AI算法学习者 | 热爱写作与技术分享
关注 河岳日星的 GitHub
公告
欢迎来到河岳日星的博客,记录技术与成长
最新文章
网站资讯
文章数目 :
35
已运行时间 :
本站总字数 :
43.2k
本站访客数 :
本站总访问量 :
最后更新时间 :
一言
:D 获取中...
:D 获取中...