avatar
文章
33
标签
5
分类
6
主页
小记
时间线
关于
友链
书架
游记
Blog de ffffurina
主页
小记
时间线
关于
友链
书架
游记

Blog de ffffurina

阿尔山之旅
发表于2025-12-02|游记
草原的张力明天再写 异国的落日 阿尔山 美食
标日 1-3单元
发表于2025-12-01|日语词汇
第一单元 汉字 假名 中文 会社員 かいしゃ いん 学生 がくせい 留学生 りゅう がくせい 初めまして はじ ~ 旅行 りょこう 中国 ちゅうごく 大学 だい がく 東京 とうきょう 雑誌 ざっし 万年筆 まんねんひつ 钢笔 新聞 しんぶん 新闻,报纸 科学 かがく 化学 かがく 歴史 れきし 友達 ともだち 辞書 じしょ 英語 えいご フランス france アメリカ america 図書館 としょ かん 体育館 たいいく かん 体育 たいいく 郵便局 ゆうびん きょく 局 きょく デパート depart 教室 きょうしつ 居室 きょしつ 駅 えき 売り場 うりば 柜台 幾ら いくら 多少钱 頂く いただく 接受,获得,吃 映画館 えいが かん 靴 くつ 鞋子 店員 てん いん 隣 となり 旁边 一階 いっかい 一楼 鞄 かばん 包 大きい おおきい 左...
24 假定形:ば形
发表于2025-12-01|日语语法
还记得我们在 Lesson 20 学过一个“万能”的 ~たら (tara) 吗?既然有了万能的 tara,为什么还需要 ba?如果说 tara 是口语中的“万能胶”(既表示“如果”也表示“之后”),那么 ba 就是逻辑严密的“电路开关”。它专门用于表示 “只要满足条件 A,就必然发生结果 B”。 Lesson 24: 绝对逻辑开关 —— ⑦ば形 (Ba-form)1. 变形算法 (The Algorithm)动词 (Verb): 全员 e 段Ba 形的变形规律和我们刚复习的“可能态”、“命令形”一样,都聚焦在 e段 上。 Group 1 (五段): u段 $\rightarrow$ e段 + ば 逻辑:把词尾的 u 变成 e,然后加 ba。 書 (か) く $\rightarrow$ 書 (か) け + ば $\rightarrow$ 書 (か) け ば (如果写的话) 行 (い) く $\rightarrow$ 行 (い) け + ば $\rightarrow$ 行 (い) け ば (如果去的话) 飲 (の) む $\rightarrow$ 飲 (の) め + ば $\r...
3 RNN&Transformer
发表于2025-12-01|计算机视觉
这一章的内容讲述了深度学习领域的第二次范式转移:从专注于处理网格数据的 CNN,转向处理序列数据的 RNN,最终收敛于目前统治 CV 和 NLP 领域的 Transformer。 第一阶段:序列建模与 RNN (Recurrent Neural Networks)在 CNN 中,我们处理的是固定大小的输入(如 $224 \times 224$ 的图像)。但在现实世界中,很多数据是变长的序列(如文本、语音、视频流)。 1. RNN 的核心思想RNN 的设计初衷是为了处理序列数据。它的核心在于拥有一个“内部状态” (Internal State),即隐藏层 $h_t$。 递推公式:$ht = f_W(h{t-1}, x_t)$ 。 $h_t$:当前时刻的隐藏状态。 $h_{t-1}$:上一时刻的隐藏状态(记忆)。 $x_t$:当前时刻的输入。 $W$:权重参数。关键点:在所有时间步中,权重 $W$ 是共享的 。 这与 CNN 在空间上共享权重(卷积核)有异曲同工之妙,RNN 是在时间上共享权重。 2. 应用模式RNN 极其灵活,PPT 展示了多种输入输出模式: One-t...
4 Image Generation Intro
发表于2025-12-01|计算机视觉
1. 自回归模型 (Autoregressive Models)1.1 核心思想自回归模型将联合概率分布 $p(x)$ 分解为一系列条件概率的乘积。假设图像 $x$ 由序列 $(x_1, x_2, …, x_T)$ 组成(例如按光栅扫描顺序的像素),则: p(x) = \prod_{t=1}^{T} p(x_t | x_1, ..., x_{t-1})1.2 训练与生成 训练:通过最大似然估计 (MLE) 优化参数 $W$,F即最大化 $\sum_i \log p(x^{(i)})$. 生成:是一个串行过程。先生成 $x_1$,再根据 $x_1$ 生成 $x_2$,依此类推。 1.3 经典模型 PixelRNN / PixelCNN:逐像素生成图像。利用 RNN (LSTM) 或 掩膜卷积 (Masked CNN) 来建模长程依赖。输出层通常使用 Softmax 在 $[0, 255]$ 的离散空间上预测像素值。 ImageGPT:基于 Transformer 的自回归模型。将图像像素序列化后输入 GPT,利用注意力机制捕捉全局依赖。 2. 变分自编码器 (Vari...
6 Object Detection
发表于2025-12-01|计算机视觉
1. 任务定义与挑战目标检测的任务不仅是判断图像中有什么(分类),还要确定它们在哪里(定位)。 1.1 任务定义 输入:单张 RGB 图像。 输出:一组检测到的物体 ${ (c_i, b_i) }$,其中: $c_i$ 是类别标签(如“猫”、“车”)。 $b_i$ 是边界框 (Bounding Box),通常表示为 $(x, y, w, h)$,即中心坐标及宽高。 1.2 核心挑战 输出数量不固定:图像中可能包含 0 到任意多个物体,无法像分类任务那样输出固定维度的向量。 多任务学习:需要同时进行分类(离散)和回归(连续)。 尺度变化:物体在图像中的尺寸差异巨大。 1.3 评估指标 IoU (Intersection over Union):交并比,用于衡量预测框与真实框 (Ground Truth) 的重叠程度。 \text{IoU} = \frac{\text{Area of Overlap}}{\text{Area of Union}} mAP (mean Average Precision):各类别的平均精度 (AP) 的均值,是衡量检测器性能的黄金标准。 ...
1. CNN
发表于2025-12-01|计算机视觉
一 从全连接层到卷积:1.为什么MLP的全连接层不适用于图像分类任务?我们之前讨论的多层感知机十分适合处理表格数据,其中行对应样本,列对应特征。对于表格数据,我们寻找的模式可能涉及特征之间的交互,但是我们不能预先假设任何与特征交互相关的先验结构。 假设我们有一个足够充分的照片数据集,数据集中是拥有标注的照片,每张照片具有百万级像素,这意味着网络的每次输入都有一百万个维度。 即使将隐藏层维度降低到1000,这个全连接层也将有$10^6×10^3$个参数。此外,MLP在处理图像前,需要将其“展平”(flatten)成一个一维向量。这个操作完全破坏了图像固有的空间结构信息(例如,像素之间的邻近关系、物体的局部形状等),而这些信息对于理解图像内容至关重要。 如今人类和机器都能很好地区分猫和狗:这是因为图像中本就拥有丰富的结构,而这些结构可以被人类和机器学习模型使用。卷积神经网络(convolutional neural networks,CNN)就是机器学习利用自然图像中一些已知结构的创造性方法。 2.卷积的原理——空间不变性:以从一张图片里找到一个对象的任务为例,因为对象不管在哪里,其...
政治学通识
发表于2025-12-01|读书笔记
何为政治?中国古代的思想分野:孔子vs韩非子孔子:过于强调领导者道德,不现实,但也有意义韩非子:认为君主应该用赏罚,帝王心术,同时人性自私,“经济人假设”的雏形 古希腊的理解政治就是公民参与城邦事物,而且是直接民主,专制根本不算是政治;存在公私空间的划分和维护体系 现实主义政治观 马基雅维利《君主论》,政治无关道德,为了更好统治,国王应当扩大权力,绝对的君主专制,有利于国家的作恶是好的(反直觉:马基雅维利认为民主比君主制更好); 马克斯韦伯:面对亡国风险,强调民族利益,民族国家; 施米特:反自由主义,自由主义是非军事化非政治化的,阻碍国家权力,需要划分敌友,必要时诉诸暴力现代定义 1 前提——政治共同体(国家) 2 产生——公共领域; 3 处理的问题:公共政策选择; 4 集体决策形式:民主/威权; 5 行政机构与强制力机构 什么是政治学岛屿寓言 第一个智者关心的问题是我们在岛上应该构建何种政治秩序。如 法理统治 第二个智者关心的问题是我们在岛上能够构建何种政治秩序。人性的缺陷让任何政治形式都不完美。前者是“应然”的问题,关注应该怎样;后者是“实然”的问题,关注事实怎样。这是两...
26 使役形
发表于2025-11-29|日语语法
好,我们继续完成动词变形的拼图。首先,我们来 Check 一下 Lesson 25 (被动形) 的作业,看看你的“受害视角”切换得是否顺畅。 ✅ Lesson 25 习题参考答案 (Debug) 变形训练: 原形 意思 ⑨ 被動形 (Passive) 备注 盗 (ぬす) む 偷 盗 (ぬす) まれる G1 mu $\rightarrow$ ma 壊 (こわ) す 弄坏 壊 (こわ) される G1 su $\rightarrow$ sa 見 (み) る 看 見 (み) られる G2 去 ru + rareru 招待 (しょうたい) する 招待 招待 (しょうたい) される G3 suru $\rightarrow$ sareru 基本被动句: 我被狗咬了。 私 (わたし) は 犬 (いぬ) に 噛 (か) まれました。 (噛む $\rightarrow$ 噛まれる) 受害/所属被动: 我被弟弟弄坏了相机。 私 (わたし) は 弟 (おとうと) に カメラ を 壊 (こわ) されました。 (Check: 助词 に 标记弟弟,を 标记相机...
25 被动形
发表于2025-11-29|日语语法
好的,我们继续按照“动词全制霸”的路线图推进。 首先,让我们快速 Debug 一下 Lesson 24 (ば形/假定形) 的代码。这一步是为了确保你的逻辑开关(Logic Gates)工作正常。 ✅ Lesson 24 习题参考答案 (Debug) 变形训练: 原形 意思 ⑦ ば形 (Ba-form) ④ 否定ば形 (Nakereba) 読 (よ) む 读 読 (よ) め ば 読 (よ) ま なければ 見 (み) る 看 見 (み) れ ば 見 (み) なければ する 做 す れ ば し なければ ある 有 あ れ ば なければ (从 nai 变来) 句子翻译: 如果读了这本书,你就明白了。 この 本 (ほん) を 読 (よ) め ば 、分 (わ) かります。 如果不快点的话,就迟到了。 急 (いそ) が なければ 、遅 (おく) れます。 (G1 急ぐ $\rightarrow$ Isoga) 表达后悔: 哎,要是问了老师就好了。 先生 (せんせい) に 聞 (き) け ば よかった。 Lesson 25: 视角的反转 —...
12…4
avatar
ffffurina
超越技术,丈量世界
文章
33
标签
5
分类
6
Follow Me
公告
This is my Blog
最新文章
阿尔山之旅2025-12-02
标日 1-3单元2025-12-01
24 假定形:ば形2025-12-01
3 RNN&Transformer2025-12-01
4 Image Generation Intro2025-12-01
分类
  • 日语24
    • 词汇1
    • 语法23
  • 游记2
  • 计算机视觉6
  • 读书笔记1
标签
政治 日本 语言 旅游 摄影
归档
  • 十二月 2025 8
  • 十一月 2025 25
© 2025 By ffffurina框架 Hexo 8.1.1|主题 Butterfly 5.5.2