V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
xoxo419
V2EX  ›  问与答

有一个关于旅游的 APP,复制小某书的旅游攻略文章后,就可以把地点提取出来。其技术原理是什么 如何区别哪些文字是地点?

  •  
  •   xoxo419 · 33 天前 · 1623 次点击
    这是一个创建于 33 天前的主题,其中的信息可能已经有所发展或是发生改变。
    9 条回复    2024-11-24 23:47:08 +08:00
    mumbler
        1
    mumbler  
       33 天前
    以前很难,现在有大模型就太简单了,监控剪贴板,把文字内容发给大模型去识别是否是旅游攻略,如果是提取地点
    yinmin
        2
    yinmin  
       33 天前 via iPhone
    处理这种业务,30B 规模的 ai 大模型很完美了,我估计最新的 7B 、11B 也可以。本地部署 mac mini M4 pro 能跑到 100+token/s
    WaveFunction
        3
    WaveFunction  
       33 天前 via Android   ❤️ 3
    关键词:实体命名识别( NER )
    iOCZS
        4
    iOCZS  
       33 天前
    你是一个旅行家,请帮从这段旅游攻略中提取出描述的地址信息。
    opengps
        5
    opengps  
       33 天前
    地点容易,先用爬虫爬取相关的资源,比如行政区域名称,地图 poi 名称
    paopjian
        6
    paopjian  
       33 天前
    通用地址名词使用 NER,配合用户自己打标签, 压根不用 LLM 就能做到
    hertzry
        7
    hertzry  
       33 天前
    命名实体识别 (NER) 是一项任务,其中模型必须找到输入文本的哪些部分对应于诸如人员、位置或组织之类的实体。
    yufeng0681
        8
    yufeng0681  
       32 天前
    @WaveFunction #3 以前还要专门的 NLP 工程师,现在被 ai 平替了
    WaveFunction
        9
    WaveFunction  
       32 天前 via Android
    @yufeng0681 是的,基础 NLP 任务现在基本上 LLM 一把梭了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5373 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 07:37 · PVG 15:37 · LAX 23:37 · JFK 02:37
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.