我们正在构建一个双模态(声学+视觉)蚊子感知系统,目标是快速实现原型。根据用户要求,主打“快”,不看书,纯小白快速上手。因此,我们需要极简方案,用现成硬件和开源代码拼装。
核心思路:
极简硬件清单(总成本≈100元):
极简软件方案:
步骤(7天内完成):
Day1:声学硬件连接(麦克风→STM32→串口),测试录音和频谱分析(Python+Scipy)。
Day2:视觉硬件连接(摄像头→树莓派),测试背景差法+目标框选(OpenCV)。
Day3:双模态融合测试,当声学和视觉同时触发时,打印蚊子坐标。
Day4-7:优化(YOLO训练、参数调优、界面美化)。
关键开源资源:
注意:所有代码尽量用现成示例,改参数即可。优先保证“能跑通”,再迭代优化。
不搞复杂理论,直接**“声学抄频谱代码,视觉抄检测代码,融合改判断逻辑”**,7天内让系统“看到+听到”蚊子。
模块 | 组件 | 成本 | 核心功能 | 二手/拆机方案(省钱) |
---|---|---|---|---|
声学 | 驻留体麦克风 | 5元 | 采集蚊子振翅声(400-600Hz) | 某宝搜“驻留体麦克风 高灵敏度” |
STM32F103C8T6最小系统板 | 15元 | 采集麦克风信号+串口发频谱数据 | 某鱼搜“STM32F103C8T6 二手” | |
视觉 | 树莓派Camera V2 | 30元 | 采集蚊子图像(30fps) | 某鱼搜“树莓派摄像头 二手” |
树莓派Zero 2W | 60元 | 运行视觉检测+双模态融合 | 某鱼搜“树莓派Zero 2W 二手” | |
辅助 | 面包板+杜邦线 | 10元 | 硬件连接 | 某宝搜“面包板套件 新手” |
USB电源(5V) | 0元 | 供电 | 复用手机充电器 |
audio localization stm32
→ 克隆现成工程,改2个参数:
PA0
);115200
(树莓派默认串口波特率)。background_subtractor.py
代码,改2个参数:
history=500
(环境越稳定,数值越大);min_area=20
(蚊子轮廓面积>20像素才判定)。yolov5n.pt
模型,改1个参数:
conf_thres=0.7
(降低误检,提高“蚊子”识别可信度)。天数 | 任务 | 交付物 | 避坑要点 |
---|---|---|---|
Day1 | 声学硬件接线+串口测试 | 串口输出频谱文本 | 麦克风正负极别接反! |
Day2 | 视觉硬件接线+背景差法测试 | 视频里出现移动白块 | 光线太暗开台灯(蚊子怕强光) |
Day3 | YOLOv5训练(自拍蚊子视频) | 能框出蚊子的模型 | 训练时用10张图也能跑,别贪多 |
Day4 | 双模态融合测试 | 同时触发时输出蚊子坐标 | 声学延迟<50ms内都算正常 |
Day5 | 优化:加红外补光/滤噪声 | 暗环境下也能检测 | 红外灯某宝5元包邮 |
Day6 | 优化:加简单界面(显示坐标) | 手机/电脑能看到蚊子位置 | 用Python的Tkinter库,10行代码 |
Day7 | 实景测试(房间放蚊子) | 系统稳定输出蚊子坐标 | 蚊子少时用“蚊香烟雾+纸飞机”模拟 |
audio-localization-stm32
(选Star多的,改引脚即用)。yolov5n
→下载 yolov5n.pt
,自拍10张蚊子图就能训。conf_thres=0.5
)。此方案0理论推导,全实操抄代码,7天内必让系统“听到+看到”蚊子!现在立刻下单硬件,Day1今晚就能让STM32输出频谱~