Bright data 挑战赛 - 行业 AI 监督机构

我建造了什么

将行业特定新闻汇总为三个 KPI 的网络应用程序。

该应用程序提供的价值是,用户只需看一眼这些 KPI 值就可以了解他们的行业是否发生了什么事情。

我开始开发这个应用程序是为了解决一个**业务问题**,但发现使用人工智能来替代更严格的算法似乎是一个很好的补充。

工作原理

用户将指定

  • 他们的来源(网站和选择器)
  • 他们的分数(加权关键词)
  • 在应用程序计算三个指标之前:

  • 相关性指数:他们的来源与他们的得分有多相关(指数越高=越好)
  • 影响指数:行业当前发生的影响(指数低=更好)
  • 行业指数:相关性和影响力的综合结果(指数高意味着用户应该了解该行业正在发生的事情)
  • AI 还将提供分析摘要作为结果的一部分
  • 我在这里省略了一些有关提示和评分的细节,但如果您好奇,您可以在代码库中找到它们:

  • OpenAI 提示
  • 评分算法
  • 演示

    代码库

    您可以在 Github 上找到该存储库。它使用 Deno+Fresh 编写,可快速设置,请按照 `readme.md` 说明开始使用。我添加了一些来源和评分,以便您可以快速开始使用。

    tq-bit / 行业监督

    行业监管机构

    该项目是 dev.to 上 Bright Data 挑战赛的原型项目。IW 让用户快速浏览单个 KPI,了解其行业是否正在发生某些事情。

    入门

  • 克隆仓库
  • 安装 Deno
  • 将 .env.example 重命名为 .env 并设置 BROWSER_WS 变量
  • 运行 deno task start
  • 导航到 http://localhost:8000,添加您的来源和分数并运行索引过程
  • 如何使用

  • 删除所有来源和分数
  • 按照主页上的步骤操作
  • 运行索引过程
  • 在 GitHub 上查看

    截图

    **概述和起始页**

    Image description

    **源维护**

    Image description

    **得分维护**

    Image description

    如何使用 Bright Data

    Bright Data 为浏览器抓取提供了安全性和可扩展性,这对于索引数据的可用性和完整性至关重要。Industry Watchdog 使用 Bright Data 浏览器抓取来同时抓取多个来源并规避可能的验证码问题。使用其广泛的代理网络可确保关键文章被考虑用于分析。

    基本上,这个项目也可以符合提示 2 的资格:构建 Web Scraper API 来解决业务问题,但是它不是使用 Brightdata 的 API,而是使用抓取浏览器。

    对于使用内部和外部数据来监控其业务策略和运营并希望通过**行业指数**扩展其 KPI 收集的分析公司和 BI 部门来说,该应用程序非常有用。

    DEV 挑战现已开始!

    DEV Challenges Hub

    查看所有参与方式、证明您的技能并赢取奖品。

    访问挑战中心