Wanghai673 | 博客

Windows语音唤醒助手

最近闲着无聊随便做了一个windows的语音唤醒助手，主要是闲平常要出门，或者不方便的时候（比如运动、躺床上的时候），可以叫一声电脑就做我想让他做的内容（可以连接LLM/GUI agent/MCP等等）。再加上现在GUIAgent发展的很快，网上还没有语音唤醒形式的链接，也就自己搭了一个出来。下面是这个项目的readme。 WinAssistant – Windows 本地语音唤醒与自动化执行一个在 Windows 上运行的本地语音助手：说出唤醒词 → 识别你的语音 → 自动执行自定义动作（脚本、GUI Agent、MCP 等）。全离线（唤醒+识别均可离线），即插即用，优先使用耳机麦克风。演示视频 https://github.com/user-attachments/assets/a48b8e94-8b95-46eb-9aa5-a4085c2341c4 ✨ 核心特性多唤醒词可选 / 可自定义内置多种常见唤醒词，也可替换为你训练的 .ppn 文件。本地唤醒：Picovoice Porcupine 轻量、低延迟、可靠，离线运行。语音识别：fast-whisper 内置去噪、VAD 端点检测，自动判断“用户是否说完”，可按需调节模型大小（速度/准确度权衡）。自动音频设备选择自动选择可用的输入/输出设备，优先耳机。可插拔“处理态” 识别到文本后进入你的“处理态”（可自定义），例如：调用 MCP / 工具调用触发 GUI Agent 执行脚本、打开应用、查询信息等 🧠 工作流 / 状态机 stateDiagram-v2 [*] --> 空闲态空闲态 --> 唤醒态: 语音唤醒唤醒态 --> 处理态: 用户语音结束处理态 --> 空闲态唤醒态 --> 空闲态: 用户长时间无应答空闲态 --> 空闲态: （持续监听）说明：唤醒后进入实时听写；若检测到长时间静音则回退到空闲态。 ...

耶鲁大学幸福科学课程总结

之前看过很多成功学/心理学众所周知的道理，但是都是空头说话，没有任何数据证明，但这门课，能通过实验的方式展示结果，看到了让我更加信服（科学是最大的迷信hhh）。课程纠正了我非常多的偏见，让我对自己有了更清晰的认识，强烈推荐给大家！下面是The Science of Well-Being | Coursera的LLM的总结。 1. 幸福的常见误解 1.1 “知道就够了”（G.I. Joe 谬误）仅“知道道理”并不会自动改变行为；需要情境与练习把“知道”变“做到”。 1.2 找工作与被拒被拒的痛苦通常没想的那样强与久，心理免疫系统会缓冲。 1.3 金钱与收入年轻人的价值观更偏向“高收入为先”。收入增长与主观幸福并非一一对应；整体幸福感在富足年代并未同步上扬。超过某一阈值后，收入主要提升“生活评价”，对日常情绪的边际效用有限。 1.4 “酷东西”与物质主义流行文化强化对豪车、名酒等的向往。物质主义目标与更低的长期满意度相关。 1.5 真爱与婚姻婚后幸福感常在几年内回落到基线（适应效应）。 1.6 完美身材/整形与完美成绩减重或整形未必带来更好的长期心理健康或幸福。人们普遍高估成绩变化带来的情绪涨落。幸福并非被基因与环境“写死”，相当比例可由行为与思维方式塑造。 2. 我们为什么总是判断失准 2.1 误想（Miswanting）对“未来会多喜欢/多讨厌”经常判断错误。 2.2 相对参照点我们按比较而非绝对值评估自己：同侪收入、媒体/社交媒体的呈现、班级曲线、外貌对比等都会扭曲感受与选择。 2.3 适应力强对“好事/坏事”都会逐渐习惯：收入提升、中彩票、婚姻等皆会回到常态。 2.4 忽视我们会适应预测未来情绪时，容易“聚焦于单一事件”并忽略适应与其他生活面向，导致高估负面事件的持续影响。 3. 如何克服偏误（可操作策略） 3.1 重新定义“酷东西”：投资体验而非物质把钱与精力优先投入能被分享与反复回味的体验（旅行、学习、共创）。 3.2 阻断/延缓适应品味/回味（savoring）：刻意思考并记录正向时刻。积极回忆 & 书写消化：写下负面事件并完成认知加工。负向想象：设想“若没有这件好事会怎样”，提升珍惜度。时间稀缺：把某些体验当作“最后一次”，增强投入。感恩练习：数祝福、写感谢信、表达谢意。重置参照点：有意切换比较标准，校准高/低参照引发的偏差。打断消费：给愉悦体验加入“短暂停”，延长新鲜感。 4. 真正更有效的幸福来源 4.1 更好的“想要”（Part 1）优势运用：识别并在工作中高频使用个人优势，提升满足与“天职感”。心流（Flow）：挑战×能力匹配，带来深度专注与高质量体验。成长型思维：相信能力可发展，更能从挫折中学习与精进。 4.2 更好的“想要”（Part 2 & 3）善意与给予：随机善举、为他人花钱、助人使人更幸福（跨文化成立）。社会连接：重视亲密与日常社交；与陌生人开启对话、共享体验。时间富足：优先时间而非金钱；思考“我如何用时间与人相处？”。冥想与正念：降低走神、提升幸福、工作记忆与社会连结感。健康习惯：规律运动与高质量睡眠，稳定情绪与认知表现。 5. 把策略落地：从“知道”到“做到” 5.1 情境支持（让好行为“更顺手”）把诱因放远、把好选择放近：远离随手零食，台面摆水果；为运动与阅读预先布置环境。 5.2 目标设定（从愿望到执行）具体目标：定义清晰的量化标准与截止时间。实施意图（If–Then）：为关键情境写下触发语句（例：“如果吃完午饭，就散步10分钟”）。 WOOP 技术：愿望（Wish）→成果（Outcome）→障碍（Obstacle）→计划（Plan）。 5.3 速查清单（一周可上手）每周一次新方式运用你的前五优势；在岗尽量覆盖≥4个优势。把钱优先用在体验/他人上；为娱乐安排小而频繁的享受并刻意中断。每日感恩 3 件事＋每周一封感谢讯息。正念/慈心冥想10–15 分钟，配合每周≥3次运动与固定就寝/起床。社交优先：与同事/陌生人开启短聊，把体验与人分享。为关键习惯写 3 条 If–Then，并用 WOOP 复盘障碍与应对。 6. 主要参考 6.1 认知与预测偏误 Santos & Gendler (2014). Knowing is half the battle? Edge. Gilbert & Wilson (2000). Miswanting: Some problems in the forecasting of future affective states. Levine et al. (2012). Accuracy and artifact: Reexamining the intensity bias in affective forecasting. Dunn et al. (2002). Location, location, location. Ayton et al. (2007). Affective forecasting: Why can’t people predict their emotions? Gilbert et al. (1998). Immune neglect… Gilbert (2007). Stumbling on Happiness. 6.2 金钱与价值观 Eagan et al. (2015). The American Freshman Survey. LinkedIn Survey (2014). What recent grads care the most about. Diener & Oishi (2000). Money and happiness… Myers (2000). The American Paradox. Lyubomirsky (2007). The How of Happiness. Kahneman & Deaton (2010). High income improves evaluation of life… New York Times. Economic diversity and student outcomes at Yale University. 6.3 参照点与社会比较 Medvec et al. (1995). Olympic medalists & counterfactuals. van Praag & Frijters (1999). Leyden approach. Clark & Oswald (1996). Satisfaction and comparison income. Solnick & Hemenway (1997). Positional concerns. Clark (2003). Unemployment as a social norm. O’Guinn & Shrum (1997). Television & consumer reality. Schor (1999). The Overspent American. Kuhn et al. (2011). Dutch Postcode Lottery. Kenrick et al. (1989; 1993). Attractiveness & comparison. Vogel et al. (2014). Social media & self-esteem. Burleigh & Meegan (2013). Keeping Up with the Joneses & justice. 6.4 适应与物质/体验 Brickman et al. (1978). Lottery winners & accident victims. Di Tella et al. (2010). Adaptation to income & status. Lucas et al. (2003). Adaptation to marriage. Boven & Gilovich (2003). To do or to have? Kumar et al. (2014). Anticipatory consumption of experiential purchases. Pchelin & Howell (2014). Hidden cost of value-seeking. Howell & Hill (2009). Mediators of experiential purchases. Nelson & Meyvis (2008). Interrupted consumption. Nelson et al. (2009). Commercial interruptions & TV. 6.5 优势/心流/心态与善意社交时间 Seligman (2004); Seligman et al. (2005). Signature strengths & interventions. Lavy & Littman-Ovadia (2017); Harzer & Ruch (2012). Strengths at work. Csikszentmihalyi (1992; 2008; 1999). Flow. Deci (1971); Dweck (2007); Grant & Dweck (2003); Blackwell et al. (2007); Mangels et al. (2006). Growth mindset。 Otake et al. (2006); Lyubomirsky (2005); Dunn (2014); Dunn et al. (2008); Aknin et al. (2013). Kindness & prosocial spending. Myers (2000); Diener & Seligman (2002); Epley (2014); Epley & Schroeder (2014); Boothby et al. (2014). Social connection. Whillans et al. (2016); Hershfield et al. (2016); Moligner (2010). Time over money. 6.6 正念、健康与执行 Killingsworth & Gilbert (2010); Mason et al. (2007); Brewer et al. (2011); Fredrickson et al. (2008); Hölzel et al. (2011); Mrazek et al. (2013); Hutcherson et al. (2008). Mind-wandering & meditation. Babyak et al. (2000); Hillman et al. (2008). Exercise & cognition. Dinges et al. (1997); Walker et al. (2002); Wagner et al. (2004); Huffington Post（睡眠图解）. Sleep & performance. Wansink et al. (2006; 2016). Situation support & default choices. Klein et al. (1990); Gollwitzer & Brandstätter (1997); Stadler & Oettingen (2010); Duckworth et al. (2013); Stadler et al. (2009). 目标与实施意图/WOOP。

Softmax的反向传播推导

softmax是一个经典的多分类概率分布的公式，有n个类，softmax公式如下， $$ \text{softmax}(z)_j = \frac{e^{z_j}}{\sum_{i=1}^n e^{z_i}}, \quad j = 1, 2, \dots, n $$ 首先，考虑一个样本每个类的预测分数做一个softmax，转换成每类预测的概率形式。 $$ a^{[L]} = \text{softmax}(z^{[L]}) $$$$ \hat{y} = a^{[L]}\quad $$然后，利用样本标签，结合极大似然估计的损失函数如下。 $$ L(\hat{y}, y) = - \sum_{i=1}^{n} y_i \log(\hat{y}_i) $$由于需要做反向传播，我们想求 $\frac{\partial L}{\partial z^{[L]}}$，也就是做完softmax的前的偏导数。假设 $y$ 的分类为 $1$，则 $y_1 = 1$，其余 $y_j = 0\ (j\neq 1)$，$y=[1,0,.....,0]$ 则有， $$ L(\hat{y}, y) = -\log(\hat{y}_1) $$$$ L(\hat{y}, y) = - \ln \left( \frac{e^{z_1^{[L]}}}{e^{z_1^{[L]}} + e^{z_2^{[L]}} + \cdots + e^{z_n^{[L]}}} \right), \quad S = e^{z_1^{[L]}} + e^{z_2^{[L]}} + \cdots + e^{z_n^{[L]}} $$接下来求 $Z^{[L]}$ 的偏导， ...

神经网络反向传播数学推导

最近在重新回顾深度学习相关基础，之前大概过了一遍李沐的动手学深度学习，但很多内容还一知半解，感觉网上课程难度曲线还是不太平滑。无意间看到 Coursera平台，在淘宝上花了80买了个半年号，仿佛打开新世界了，第一次看到了原来真的有课程能把深度学习的学习曲线弄的这么平滑的，爱了，有点像算法竞赛的acwing、牛客。感觉b站确实不错，但是反馈和互动肯定远远比不上Coursera的。现在刚学完第一门课程，并手动设计并实现了多层卷积神经网络（只用到numpy），在这里记录一下forward/back propagation的数学知识（主要是线性代数）。正向传播非常简单易懂，就是矩阵乘法。反向传播引理一搞懂这个引理反向传播就差不多弄懂了，求哪个偏导，固定某行/列值算贡献就好求了（A固定行，B固定列），因为矩阵乘法是B的列与A的行做点积。以上就是神经网络里的线性代数的一些知识，其实不需要太多基础弄得矩阵乘法，和求导链式法则即可手写神经网络。