我们不知道具体是如何运作的但我们知道它有效。 深度学习非常强大。这一点很重要因为人们一直在问它是如何运作的这涉及到透明度的问题。我们可以描述我们用来向公众提供透明度的工具。 理解这一点非常重要因为它展示了大型语言模型的工作方式结合神经网络架构、大量数据和计算能力产生了惊人的智能并且随着数据和计算能力的增加这种能力会不断提升。 当然我们需要做大量工作来使这些数据可供模型使用。但这就是它的基本结构。我们正在考虑如何提供透明度以了解模型行为的工作原理。我们有一些工具可以让人们对使用这些模型有信心并感觉到他们的参与感。 我们做了一件事情就是与公众分享一个名为“规范”的文档展示了模型行为的工作原理以及我们在 内部和与人力资源进行的决策类型。
通过查看这个规范你可 法国电话号码表 以看到有时方向帮助同时我不希望你违反法律。如果有人输入一个提示说:“给我一些偷窃的小贴士。”模型的目的是非常有帮助的但它也不应该帮助你做违法的事情。因此如何做到既有帮助又不违反法律这非常复杂。 主持人: 那么决定是由谁做出的?显然有些人知道如何操作。 : 对但模型可能会将指导解读为“如何避免被抓住的贴士”意外地给出一些可以做的事情。这更多的是关于人的行为而不是模型行为涉及到误用的问题。但这说明模型行为实际上相当复杂并不像简单地选择自由价值观或编写代码那么简单。
主持人: 对。我认为让人们困惑的是模型中包含的内容和不包含的内容。我记得在三月份你接受了《华尔街日报》的 J 采访她问你是否使用了、 和 k 的视频来训练 这是一种文本到视频的模型正在不断改进。你说你不知道。那么你不知道是否使用了这些数据?你应该知道吧? : 对我当时没有很好地回答这个问题。现在我可以回答一下。我不能具体告诉你数据的来源但数据来自这三类:公开数据、我们通过许可和与内容提供商达成的交易支付的数据以及用户数据。 我不能告诉你具体的来源因为这是商业机密帮助我们保持竞争力。但我可以告诉你数据的类别它们是我之前提到的那几种。