Self AI LogoSelf AI
February 20, 2026

一键语音笔记:用 iOS 捷径打造无摩擦的想法捕捉系统

用 iOS 捷径 + OpenAI Whisper API 实现一键录音转文字,自动保存到 Obsidian

为什么要做这个

灵感不等人。散步时、洗澡时、对话中,想法稀纵即逝。等你解锁手机、打开 App、开始打字,一半的思绪已经消散。

我的笔记系统是 Obsidian,通过 iCloud 同步。它擅长组织和连接想法,但不适合快速捕捉——打开应用、新建笔记、打字,步骤太多。

我需要的是:点一下,说完,收工。

做了什么

一个 iOS 捷径,实现:

  1. 一键录音
  2. 自动调用 OpenAI Whisper API 转文字
  3. 音频和文字同时保存到 Obsidian

成本:Whisper API 约 $0.006/分钟,个人使用几乎免费。

怎么做的

准备工作

  • Obsidian 仓库同步到 iCloud
  • OpenAI API Key

捷径步骤

  1. 录制音频 - 质量选普通即可
  2. 编码媒体 - 转换为 M4A 格式
  3. 存储文件 - 保存到 Obsidian/仓库名/Audio
  4. 获取 URL 内容 - 调用 Whisper API
    • URL: https://api.openai.com/v1/audio/transcriptions
    • 方法: POST
    • 头部: AuthorizationBearer 你的API密钥
    • 表单: file(文件) = 编码后的媒体, model(文本) = whisper-1
  5. 获取词典值 - 键: text
  6. 文本 - 组装笔记模板:
    ## [日期] [时间]
    ![[Audio/录音文件名.m4a]]
    
    [转写文字]
    
    #voice-note
    ---
    
  7. 追加到文本文件 - 写入 Inbox.md

添加到主屏幕,完成。

效果

每条语音笔记自动出现在 Inbox.md:

## 2026-01-25 14:32
![[Audio/Audio Recording 2026-01-25 at 2.32.15 PM.m4a]]

突然想到,项目的用户引导流程可以简化成三步...

#voice-note
---

音频可直接在 Obsidian 中播放,方便回顾语气和上下文。

还能做什么

这只是起点。既然已经打通了 API 调用,可以继续扩展:

周报自动生成

再建一个捷径,每周日运行:

  1. 读取 Inbox.md 内容
  2. 调用 GPT-4 API,提示词:
    总结以下语音笔记,提取关键想法,按主题分类,指出可行动项:
    [笔记内容]
    
  3. 输出保存为 Weekly/2026-W04.md

散乱的碎片想法,自动变成结构化的周度回顾。

其他可能

  • 情绪追踪:让 AI 分析每条笔记的情绪倾向,生成月度情绪曲线
  • 待办提取:识别笔记中的任务意图,自动添加到任务管理系统
  • 主题聚类:定期分析所有笔记,发现重复出现的主题和关注点

最后

工具的价值在于降低摩擦。当捕捉想法的成本趋近于零,你会惊讶于自己每天有多少值得记录的念头。

一个捷径,一个 API,换来的是思维的自由流动。

Log in to leave a comment.

More Posts