二本应届生个人开发者产品求助：识图翻译类 App 优化与疑问 - V2EX

首页注册登录

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 40 天前的主题，其中的信息可能已经有所发展或是发生改变。

大家好！主包今年刚毕业的二本应届生，上个月面了一个北京的全栈开发岗。不出意外也是二面挂了，事后复盘时发现一、二面都被问到 “有没有自己的产品或者开源贡献”，正好我最近平时在学口语，便萌生了开发一款相关 App 的想法。目前核心功能已基本完成，但对比同行后发现待优化点很多，第一次做产品有不少问题想请教大家～

一期

核心功能：通过拍照识别物体进行语言学习

拍照识别画面中的物体
将识别结果翻译成用户指定的学习语言（如英语）
返回包含单词信息、相关短语及例句等内容

一期现有方案及问题

通过 COZE 搭建工作流实现基础功能，但存在明显瓶颈：

技术方案：采用豆包 GUI 大模型识别 + 1.6 模型构建结果
核心问题：API 调用耗时较长，且识别结果质量未达预期，大佬们有无其他识图大模型推荐？

二期

计划接入付费功能（个人开发者只能对接第三方）咨询一下前辈们有什么需要注意的吗？
想搬运个人认为优质的 YouTube 口语类 UP 主视频（用于学习场景），这种做法是否存在版权风险？需要注意什么？

第一次独立开发产品，很多地方还在摸索中，恳请各位大佬多多指点，手下留情～

2 条回复 • 2025-08-17 12:32:31 +08:00

1

huminted

40 天前

这个 idea 已经有很多人实现了。比如 iOS 上的 Piggy Words 和 CapWords

2

card123

39 天前

我感觉好像这种应用应该挺多的，像一些翻译工具上好像也有这种功能

关于 · 帮助文档 · 自助推广系统 · 博客 · API · FAQ · 实用小工具 · 3500 人在线 最高记录 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 22ms · UTC 04:28 · PVG 12:28 · LAX 21:28 · JFK 00:28
Developed with CodeLauncher
♥ Do have faith in what you're doing.