中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架

AI 6个月前 admin

149 0 0

中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架

原文标题：GenderCARE: A Comprehensive Framework for Assessing and Reducing Gender Bias in Large Language Models

原文作者：Kunsheng Tang, Wenbo Zhou, Jie Zhang, Aishan Liu, Gelei Deng, Shuai Li, Peigui Qi, Weiming Zhang, Tianwei Zhang, and Nenghai Yu

发表会议：ACM CCS 2024

论文连接：https://zjzac.github.io/publications/pdf/CCS_24_bias.pdf

主题类型：大模型安全

笔记作者：唐坤生@USTC

主编：黄诚@安全学术圈

中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架

中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架

中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架

针对LLMs的性别偏见评估与去偏框架

中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架

中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架

采用我们所提出GenderCARE框架的去偏结果

5. 论文信息

论文连接：https://zjzac.github.io/publications/pdf/CCS_24_bias.pdf

相关论文已被ACM CCS 2024接受，作者为中国科学技术大学的唐坤生、周文柏、李帅、齐培贵、张卫明、俞能海，南洋理工大学的张杰、邓格雷、张天威，北京航空航天大学的刘艾杉。

安全学术圈招募队友-ing
有兴趣加入学术圈的请联系 secdr#qq.com

原文始发于微信公众号（安全学术圈）：中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架

版权声明：admin 发表于 2024年5月8日上午9:40。
转载请注明：中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架 | CTF导航

相关文章

MSDS：一个用于笔迹认证的大规模中文签名和令牌数字串数据集

admin

590

VulDeePecker:基于深度学习的漏洞检测系统

admin

421

洞见RSAC 2024｜大模型驱动的智能安全运营

admin

84

How hackers can read your chats with ChatGPT or Microsoft Copilot

admin

30

Microsoft’s ‘AI Watchdog’ defends against new LLM jailbreak method

admin

38

文本分类（二）复杂场景下分类任务应用介绍

admin

729