架构:关于系统的结构

Dive into business data optimization and best practices.
Post Reply
suchona.kani.z
Posts: 394
Joined: Sat Dec 21, 2024 5:30 am

架构:关于系统的结构

Post by suchona.kani.z »

系统分为几个主要组件,内部按照洋葱架构进行分解,并通过适配器与外界进行通信。

采用Java的Spring Boot框架因其轻量级和灵活性而被选为核心技术。 Python 编程语言是 ML 领域事实上的标准,与 spaCy 框架一起负责自然语言处理和实体识别。 spaCy 基于神经网络。

出现了三个主要组成部分:导入/导出、搜索和人工智能/机器学习。这些都被设计为微服务。其原因在于技术组合和高吞吐量的要求,这是通过组件的冗余设计来实现的。

该图提供了组件的布置和通信与系统上下文以及彼此之间关系的高级概述。


组件之间的通信通过 REST 同步进行,通过消息队列异步进行。组件内的交换是使用 JSON 格式以技术中立的方式进行的。


组件及其任务

机器学习方法
spaCy 是一个用于 Python 高级自然语言处理的 外汇电子邮件列表 开源库,适合高效使用。在这个解决方案中,spaCy 接管了实体提取的任务。 SpaCy 的名称实体识别功能就是用于此目的。命名实体提取需要训练特定的神经网络模型。该模型通常经过优化以获得更好的结果。 spaCy 提供了一些影响神经网络学习的超参数。模型是静态的并且可以加载。 spaCy 提供了各种已经训练好的模型可供下载 - 但它们不适合此任务。

因此,特别关注用于训练模型的源数据。合成数据在这里几乎不合适,因为存在模型的好坏取决于用于创建数据的算法的风险。来自生产的匿名或假名数据往往更适合创建模型。只要数据保护允许,生产数据始终是首选。

为了让神经网络学习自己的实体,必须对数据进行注释。例如,这可以使用 Doccano 创建。训练神经网络时使用注释中的文本数据和元数据。

更好的模型不是通过大量相似的数据来实现的,而是通过数据中文本的较大方差来实现的。从总数据集中,保留四分之一的数据用于测试模型,保留四分之三的数据用于训练模型。

使用损失函数的误差梯度来评估训练,它决定了神经网络训练期间检测到的数据与预期结果之间的关系。在此基础上,确定进一步的优化。

结论
该解决方案方法说明了 AI/ML 支持的欺诈预防解决方案的优化潜力。这里存在哪些困难以及目前已经存在哪些解决方案。

您想了解更多关于 adesso 世界中令人兴奋的话题吗?那么请看一下我们之前发布的博客文章。我们当前针对银行和金融服务提供商的人工智能报告正在我们的人工智能页面上等待您。了解有关银行业人工智能的一切。

除了根据 ISO 27001 (ISMS) 进行认证外,公司还可以利用协同效应根据 ISO 20000(IT 服务管理)或 ISO 9000(质量管理)对自己的公司进行额外认证。通过应用和结合这些相关标准,可以持续有效地改进整个流程和组织。这为公司本身创造了重要的优势和更高的声誉——而且事半功倍。

ISO 20000 标准使公司能够对自己的 IT 服务管理进行认证。该标准是一项国际标准,规定了IT服务管理的最低要求。除其他外,它需要持续改进流程和集成流程方法的证据,以有效提供 IT 服务。 ISO 9000 认证了公司的质量管理。

您想了解更多关于 adesso 世界中令人兴奋的话题吗?那么请看一下我们之前发布的博客文章。

顺便说一下,通过 adesso,公司可以获得最好的安全性。在这里您可以找到有关我们服务包的所有信息。
Post Reply