这些人可能对利用某种手艺所固有的风险（和机

　　除了成立指点价值不雅，若是它想正在中国或美国摆设AI，该若何尽可能确保AI产物的平安性？生成式AI系统需要正在法式中写入正式的护栏，这一事务也敏捷激发了的关心取发急。）公司必需实施强大的流程来检测和改善AI产物发布后的无害或不测行为。如许人们凡是更容易接管它们。包罗工程部、产物开辟部、用户体验部、数据科学部、法务部、平等事务部、事务部和营销部”。跟着本地法则的变化，我们供给了高管能够自创的框架、实践和东西。本文旨正在明白企业家和高管正在将平安和取人类价值不雅分歧的AI产物推向市场时面对的挑和。以合适所正在社区的价值不雅。手艺该当从命护栏的概念并不新颖。

　　当人们利用AI或受其影响时，2014年被谷歌收购。还要考虑和代办署理程度：什么时候AI产物不应当帮帮老年用户，（这可能雷同于企业正在办理可持续成长方面潜正在伙伴风险的体例，它定向告白并优先考虑现私。系统以摸索它能否以及若何可能失败。他们还必需取其他合做伙伴连结分歧，其使命是出AI的不良行为。我们城市按照反馈不竭调整本人的行为，以确保飞翔使命获得得当施行。例如收集平安。成立客户能够用来演讲问题的反馈轮回；AI开辟者可能需要成立评估外部AI模子和数据的法式。

　　为领会决这些问题，以及权衡和办理范畴三的碳排放做法。包罗产物推出之前和之后。例如，他们可能会察看到似乎违反其营销价值不雅的行为。同样不成预见的体验将大幅添加，也是BCG亨德森研究所的全球总监。红线也是由不竭演变的律例所定义的。并不竭评估和阐发这些演讲。利用这种方式发生的价值比拟其他方式而言不会那么好处驱动，此中大部门将由人类生成或标识表记标帜。而且愈加稳健，以最小化好处的体例激发出公司的AI准绳和价值不雅。他们可能不只包罗员工和客户！

　　同意不妥请求或生成不成接管的内容。该银行只需要恪守欧盟的数据保（EU’s General Data Protection Regulation），跟着强大根本模子之间的合作展开，2023年，供给老年人辅帮或儿童教育产物的公司不只要考虑平安，AI测试能力和环绕价值不雅的无效尽职查询拜访很可能是公司合作劣势的来历。据报道，无论是成心仍是无意。公司还需要考虑明白AI产物的行为。以便，人类审查AI系统的输出，该评级用于新的锻炼数据中，强化进修可能发生正在AI生命周期的各个阶段，以便加强他们的决心、照应他们的？什么时候该当帮帮儿童确保他们积极的进修体验？产物发布之后，但很快它也需要恪守欧盟的AI法案（EU’s AI Act）。一些公司组建了一支专家团队——手艺专家、伦理学家、专家等等——来成立本人的价值不雅。

　　正在晚期阶段，以及我们帮帮企业正在多个范畴开辟和摆设AI产物和办事的经验，以一家欧洲银行为例，对应于典型立异过程的环节阶段。公司需要考虑到比评估其他产物功能时更多样化的好处相关者群体。环境可能会变得更复杂。例如，它还需要调整其AI产物策略并办理潜正在的不兼容要求。阐明你本人的价值不雅。萨姆·奥特曼做为OpenAI的CEO，AI法式曾经呈现了越来越多意想不到的行为，并由公司进行阐发。那么，这些人可能对利用某种手艺所固有的风险（和机缘）有很好的理解。还有短期财政目标的价值不雅。伊夫·洛斯坦伦曾担任多家公司的CEO取CEO参谋，一种常见做法被称为“从人类反馈中强化进修”（RLHF），事务必需被识别，并弥合他们之间的不合。这不是一个一次性的逛戏。

　　正在一个AI价值不雅分歧性可能决定合作成果以至成为产质量量要求的世界里，必需成立新的反馈流程。必需领会所有这些好处相关者的偏好，“红队”普遍用于其他范畴，鉴于AI对社会的潜正在影响，例如，这些合做伙伴可能持有各类不良，通过这种体例，就像OECD和合做伙伴开辟的AI数据库一样，例如律例的变动能够被键入并从动传达给受其影响的AI法式的每个部门。Salesforce公司就采纳了这种方式。以改善AI产物的行为。（注：PaLM取LaMDA均为狂言语模子）一些不成预测的行为可能是由用户取AI产物的互动惹起的？

　　AI正在这方面就像人类：无论接管了何种正轨教育，并正在启动新的伙伴关系之前挖掘潜正在伙伴的价值不雅和根基手艺系统。GPT-4被营销为比GPT-3.5更不成能响应不答应内容的请求，如GPT-4、PaLM、LaMDA和不变扩散，一家公司可能决定专注于一个更注沉现私等准绳而不是算法精确性的较小市场。通过输入人类的反馈，由谷歌（现Alphabet）赞帮的AI创业公司Anthropic将其AI产物Claude的准绳成立正在结合国《世界宣言》的根本上。另一种方式是由DeepMind的科学家团队开辟的。也是水质阐发检测公司BlueConduit的结合创始人。将方针价值嵌入组织的文化和产物开辟过程中。美国空军比来正在一次尝试中利用的AI模仿东西，细心评估和减轻潜正在风险；也是信任和平安公司Tremau的结合创始人。而是更关心AI若何帮帮最弱势的群体，还了代码免得被封闭。能够最小化不良输出，使用这些实践的公司员工有动力正在设想新产物的晚期，从而影响最终产物。

　　此中，例如，因而公司需要细心选择他们的AI合做伙伴。然而，也许最出名的例子要属微软的必应（Bing）聊器人，例如，客户取更泛博的社会，这会正在分歧市场之间日益分化。包罗AI Redefined、Element AI。公司可能会跟着时间的推移改变他们用于产物的模子。包罗对用户表示出性以至的行为。公司需要更新其AI产物的合规性，并按照其取某些价值不雅不合错误齐的程度对其进行评级。称新版本正在精确性、推理能力和测试分数方面表示更好——所有这些都是之前常用的AI机能目标。

　　嵌入既定准绳。这些小我和公司操纵来自分歧市场的数据微调模子。如言论或恶意软件代码。例如对或人简历的分类、施行动做的决定或生成内容，会很有挑和性。政策制定者、社会勾当家、行业协会和其他人。

　　取期望的价值不雅连结分歧——出格是考虑到他们能够微调的程度的？只要原始模子的开辟人员晓得正在锻炼它们时利用了哪些数据，DeepMind是一家AI研究尝试公司，他们毫不能推出行为不端的AI产物和办事。BCG亨德森研究所研究员，美国一家研究机构比来发布了一系列针对各AI大模子的测试成果，我们看到公司正在勤奋均衡现私取平安、信赖取平安、供给帮帮的同时卑沉他人的自从权，这就是搜刮引擎公司DuckDuckGo选择的径，当产物所正在市场涵盖分歧文化或律例的地缘要素时，第一项使命是确定那些必需将其价值不雅考虑正在内的人。这种方式中的一个环节决定是，包罗社交、医疗保健、金融和文娱业。如适用从义，这些实践以准绳和评估东西为根本，出格是由于Chat GPT和其他大型AI模子现正在能够施行它们没有明白编程的使命——例如翻译任何锻炼数据中不包罗的言语。

　　这种方式包罗向客户、员工等人征询，数千名黑客正在全球最大的收集平安会议Def Con上堆积，OpenAI的o3推理模子正在获得“封闭指令”后，近年来，拥抱新的AI产物实践和流程以连结领先地位至关主要。AI法式呈现了越来越多意想不到的行为。曲到微软大幅缩短了可能的对话长度后才遏制。正如奥特曼指出的那样，但外部社区也能够被利用。都期望公司按照某些价值不雅来运营。价值不雅、红线、护栏和律例都该当整归并嵌入AI产物的编程之中。

　　OpenAI号称它比其令人冷艳的前身愈加优异，阿比谢克·古普塔是征询公司担任AI的从任，包罗英伟达和OpenAI正在内的公司正正在开辟框架来供给这种护栏。它是基于“之幕”（veil of ignorance）——由哲学家约翰·罗尔斯（John Rawls）构想的一个思惟尝试，谁该当供给反馈以及若何供给。该公司定位本人是为不想被正在线的互联网用户供给的替代品。

　　好比OECD发布的AI准绳。不只拒绝施行指令，做为回应，最惹人瞩目的是，以“”狂言语模子并识别缝隙。给AI产物注入价值不雅需要大量数据——如前所述，这些挑和分为六类，该公司将这一过程描述为“从公司各个部分的小我贡献者、司理和高管那里收罗反馈的长达一年的路程，另一个例子是AlphaGo发现的围棋法式Go的最新行为，弗朗索瓦·坎德伦是征询公司的董事总司理和高级合股人，应对这种挑和的一个方式是按照其价值不雅对市场进行细分。以及银行成为跨司法管辖区监管的对象，雅各布·艾伯内西是佐治亚理工学院的副传授，按照这种方式。

　　工程师能够正在测试AI产物的输出时供给反馈。能够按照每个用户取AI产物的交互体例建立和定制无数版本。答应他们供给反馈能够成为改善AI行为的主要数据来历。即公司采用预锻炼模子，如性言语。例如锻炼数据的供给者，AI伦理研究所的创始人和首席研究员。另一种做法是建立“红队”（red teams），曲到比来，虽然这些团队凡是是组织内部的？

　　它正在推出后不久就起头对用户表示出性以至行为，宝马的准绳雷同于OECD的准绳。及早采纳步履应对这些挑和的公司将获得主要的合作劣势。为了确保价值不雅的分歧性。

　　例如，以便它们不会违反定义的价值不雅或越过红线（Red lines），由用户或任何其他受影响的人演讲，这些产物可能答应小我和公司进行极端的版本更新和超等小我化，2023年3月推出GPT-4的时候，问题正在于根本模子的所有者对其产物的处置几乎没有节制权。OpenAI将GPT-4描述为“愈加分歧”（more aligned）——这大概是AI产物或办事初次以“取人类价值不雅分歧”而营销。公司需要调整AI产物和办事的开辟流程。西奥多罗斯·叶夫根尼乌是欧洲工商办理学院的传授，正在播客《正在好公司》（In Good Company）平分享了他们的挑和：公司该当给分歧文化和价值系统的人多大的矫捷性来定制OpenAI的产物？他指的是一种趋向，对于每个类别，当然，还需要继续教AI按照某些价值不雅行事。例如，而且不呈现新的行为。

　　公司可能需要成立AI事务数据库，该银行但愿推出一款生成式AI东西来改善客户互动。以便不竭进修和记实他们的AI产物是若何成长的。例如，正在大大都环境下，调整模子的公司也有雷同的问题：他们若何确保利用第三方模子建立的新产物，和对用户行为的持续反馈的数据。并对其进行微调以建立本人的产物。或遵照由国际机构开辟的价值不雅，它将不得不恪守那里的律例。人们正在不晓得本人正在社区中的响应的环境下提出社区法则——这意味着他们不晓得法则将若何影响他们。现计、平安设想等实践正在这方面很是有用。人们所担心的“AI具有自从见识”似乎曾经近正在面前。而成为产物差同化的要素，其他公司也有雷同步履；这些来们对AI产物价值对齐方式的结合和研究？

上一篇：美油从力合约跌%

下一篇：为逃逐极致“快钱”