大家好!主包今年刚毕业的二本应届生,上个月面了一个北京的全栈开发岗。不出意外也是二面挂了,事后复盘时发现一、二面都被问到 “有没有自己的产品或者开源贡献”,正好我最近平时在学口语,便萌生了开发一款相关 App 的想法。目前核心功能已基本完成,但对比同行后发现待优化点很多,第一次做产品有不少问题想请教大家~
一期
核心功能:通过拍照识别物体进行语言学习
- 拍照识别画面中的物体
- 将识别结果翻译成用户指定的学习语言(如英语)
- 返回包含单词信息、相关短语及例句等内容
一期现有方案及问题
通过 COZE 搭建工作流实现基础功能,但存在明显瓶颈:
- 技术方案:采用豆包 GUI 大模型识别 + 1.6 模型构建结果
- 核心问题:API 调用耗时较长,且识别结果质量未达预期,大佬们有无其他识图大模型推荐?
二期
- 计划接入付费功能(个人开发者只能对接第三方)咨询一下前辈们有什么需要注意的吗?
- 想搬运个人认为优质的 YouTube 口语类 UP 主视频(用于学习场景),这种做法是否存在版权风险?需要注意什么?
第一次独立开发产品,很多地方还在摸索中,恳请各位大佬多多指点,手下留情~