February 20, 2026
一键语音笔记:用 iOS 捷径打造无摩擦的想法捕捉系统
用 iOS 捷径 + OpenAI Whisper API 实现一键录音转文字,自动保存到 Obsidian
为什么要做这个
灵感不等人。散步时、洗澡时、对话中,想法稀纵即逝。等你解锁手机、打开 App、开始打字,一半的思绪已经消散。
我的笔记系统是 Obsidian,通过 iCloud 同步。它擅长组织和连接想法,但不适合快速捕捉——打开应用、新建笔记、打字,步骤太多。
我需要的是:点一下,说完,收工。
做了什么
一个 iOS 捷径,实现:
- 一键录音
- 自动调用 OpenAI Whisper API 转文字
- 音频和文字同时保存到 Obsidian
成本:Whisper API 约 $0.006/分钟,个人使用几乎免费。
怎么做的
准备工作
- Obsidian 仓库同步到 iCloud
- OpenAI API Key
捷径步骤
- 录制音频 - 质量选普通即可
- 编码媒体 - 转换为 M4A 格式
- 存储文件 - 保存到
Obsidian/仓库名/Audio - 获取 URL 内容 - 调用 Whisper API
- URL:
https://api.openai.com/v1/audio/transcriptions - 方法: POST
- 头部:
Authorization→Bearer 你的API密钥 - 表单:
file(文件) = 编码后的媒体,model(文本) =whisper-1
- URL:
- 获取词典值 - 键:
text - 文本 - 组装笔记模板:
## [日期] [时间] ![[Audio/录音文件名.m4a]] [转写文字] #voice-note --- - 追加到文本文件 - 写入
Inbox.md
添加到主屏幕,完成。
效果
每条语音笔记自动出现在 Inbox.md:
## 2026-01-25 14:32
![[Audio/Audio Recording 2026-01-25 at 2.32.15 PM.m4a]]
突然想到,项目的用户引导流程可以简化成三步...
#voice-note
---
音频可直接在 Obsidian 中播放,方便回顾语气和上下文。
还能做什么
这只是起点。既然已经打通了 API 调用,可以继续扩展:
周报自动生成
再建一个捷径,每周日运行:
- 读取
Inbox.md内容 - 调用 GPT-4 API,提示词:
总结以下语音笔记,提取关键想法,按主题分类,指出可行动项: [笔记内容] - 输出保存为
Weekly/2026-W04.md
散乱的碎片想法,自动变成结构化的周度回顾。
其他可能
- 情绪追踪:让 AI 分析每条笔记的情绪倾向,生成月度情绪曲线
- 待办提取:识别笔记中的任务意图,自动添加到任务管理系统
- 主题聚类:定期分析所有笔记,发现重复出现的主题和关注点
最后
工具的价值在于降低摩擦。当捕捉想法的成本趋近于零,你会惊讶于自己每天有多少值得记录的念头。
一个捷径,一个 API,换来的是思维的自由流动。
Log in to leave a comment.