当前位置: 首页 > article >正文

力扣:182. 查找重复的电子邮箱(Python3)

题目:

表: Person

+-------------+---------+
| Column Name | Type    |
+-------------+---------+
| id          | int     |
| email       | varchar |
+-------------+---------+
id 是该表的主键(具有唯一值的列)。
此表的每一行都包含一封电子邮件。电子邮件不包含大写字母。

编写解决方案来报告所有重复的电子邮件。 请注意,可以保证电子邮件字段不为 NULL。

以 任意顺序 返回结果表。

结果格式如下例。

来源:力扣(LeetCode)
链接:力扣(LeetCode)官网 - 全球极客挚爱的技术成长平台

示例:

示例 1:

输入:

Person 表:
+----+---------+
| id | email   |
+----+---------+
| 1  | a@b.com |
| 2  | c@d.com |
| 3  | a@b.com |
+----+---------+


输出:

+---------+
| Email   |
+---------+
| a@b.com |
+---------+


解释:a@b.com 出现了两次。

解法:

现在person表中加入1列,记录email是否重复,接着把重复的留下,然后去重。

知识点:

1.DataFrame.duplicated(subset=None, keep=‘first’):查找和处理数据中的重复项,返回布尔值的Series。subset:默认为None,需要标记重复的标签或标签序列;keep:默认为‘first’,如何标记重复标签,first:将除第一次出现以外的重复数据标记为True;last:将除最后一次出现以外的重复数据标记为True;False:将所有重复的项都标记为True(不管是不是第一次出现)。比如:

data = [[1, 'a@b.com'], [2, 'c@d.com'], [3, 'a@b.com']]
person = pd.DataFrame(data, columns=['id', 'email']).astype({'id': 'Int64', 'email': 'object'})
person['duplicated'] = person.duplicated(subset='email', keep=False)

返回如下:

代码:

import pandas as pd

def duplicate_emails(person: pd.DataFrame) -> pd.DataFrame:
    person['duplicated'] = person.duplicated(subset='email', keep=False)
    email = person[person['duplicated'] == True].drop_duplicates(subset='email')
    del email['id']
    del email['duplicated']
    return email


http://www.kler.cn/a/146398.html

相关文章:

  • 如何使用 useMemo 和 memo 优化 React 应用性能?
  • 联通用户管理系统(一)
  • Python股票量化交易分析-开发属于自己的指标
  • 数仓建模:如何设计可扩展性较好的同环比计算模型?
  • 《鸿蒙Next微内核:解锁人工智能决策树并行计算的加速密码》
  • VUE学习笔记4__安装开发者工具
  • 2023最全的自动化测试入门基础知识(超详细~)
  • Cesium 问题:加载瓦片数据出现南北极未加载完全,蓝色情况
  • 【MySQL | TCP】宝塔面板结合内网穿透实现公网远程访问
  • logstash 配置文件语法介绍
  • 机器视觉 AI 数据集制作
  • 无人机光伏巡检代替人工,贵州电站运维升级
  • 5.前端--CSS-基本概念【2023.11.26】
  • 百面深度学习-自然语言处理
  • YOLOv5 分类模型 预处理 OpenCV实现
  • 【Vue】@keyup.enter @v-model.trim的用法
  • FLASK博客系列4——再谈路由
  • 4.golang中map的增删改查
  • 笔记,B+树
  • Win11修改用户名(超详细图文)
  • [网络] 4. HTTP/1.1 相比 HTTP/1.0 提高了什么性能?
  • 骑行三家村赏红杉之旅:挑战与汗水共存,美景和惊喜同行的路线
  • 自动化横行时代,手工测试如何突破重围?测试之路...
  • Kotlin学习——kt里的集合List,Set,Map List集合的各种方法之Int篇
  • mac上Homebrew的安装与使用
  • C++基础---容器