我是靠谱客的博主 大意书本,最近开发中收集的这篇文章主要介绍python类型转换代码_python-将PySpark dataframe 列类型转换为字符串并替换方括号,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

我需要将PySpark df列类型从数组转换为字符串,还要删除方括号.这是 dataframe 的架构.需要处理的列是CurrencyCode和TicketAmount

>>> plan_queryDF.printSchema()

root

|-- event_type: string (nullable = true)

|-- publishedDate: string (nullable = true)

|-- plannedCustomerChoiceID: string (nullable = true)

|-- assortedCustomerChoiceID: string (nullable = true)

|-- CurrencyCode: array (nullable = true)

| |-- element: string (containsNull = true)

|-- TicketAmount: array (nullable = true)

| |-- element: string (containsNull = true)

|-- currentPlan: boolean (nullable = true)

|-- originalPlan: boolean (nullable = true)

|-- globalId: string (nullable = true)

|-- PlanJsonData: string (nullable = true)

来自 dataframe 的样本数据

+--------------------+--------------------+-----------------------+------------------------+------------+------------+-----------+------------+------------+--------------------+

| event_type| publishedDate|plannedCustomerChoiceID|assortedCustomerChoiceID|CurrencyCode|TicketAmount|currentPlan|originalPlan| globalId| PlanJsonData|

+--------------------+--------------------+-----------------------+------------------------+------------+------------+-----------+------------+------------+--------------------+

|PlannedCustomerCh...|2016-08-23T04:46:...| 087d1ff1-5f3a-496...| 2539cc4a-37e5-4f3...| [GBP]| [0]| false| false|000576015000|{"httpStatus":200...|

|PlannedCustomerCh...|2016-08-23T04:30:...| 0a1af217-d1e8-4ab...| 61bc5fda-0160-484...| [CNY]| [329]| true| false|000189668017|{"httpStatus":200...|

|PlannedCustomerCh...|2016-08-23T05:49:...| 1028b477-f93e-47f...| c6d5b761-94f2-454...| [JPY]| [3400]| true| false|000576058003|{"httpStatus":200...|

我该怎么做?目前,我正在执行字符串转换,然后用regexp_replace替换方括号.但是当我处理大量数据时,这种方法会失败.

我还有其他方法可以做到吗?

这就是我要的.

+--------------------+--------------------+-----------------------+------------------------+------------+------------+-----------+------------+------------+--------------------+

| event_type| publishedDate|plannedCustomerChoiceID|assortedCustomerChoiceID|CurrencyCode|TicketAmount|currentPlan|originalPlan| globalId| PlanJsonData|

+--------------------+--------------------+-----------------------+------------------------+------------+------------+-----------+------------+------------+--------------------+

|PlannedCustomerCh...|2016-08-23T04:46:...| 087d1ff1-5f3a-496...| 2539cc4a-37e5-4f3...| GBP| 0| false| false|000576015000|{"httpStatus":200...|

|PlannedCustomerCh...|2016-08-23T04:30:...| 0a1af217-d1e8-4ab...| 61bc5fda-0160-484...| CNY| 329| true| false|000189668017|{"httpStatus":200...|

|PlannedCustomerCh...|2016-08-23T05:49:...| 1028b477-f93e-47f...| c6d5b761-94f2-454...| JPY| 3400| true| false|000576058003|{"httpStatus":200...|

最后

以上就是大意书本为你收集整理的python类型转换代码_python-将PySpark dataframe 列类型转换为字符串并替换方括号的全部内容,希望文章能够帮你解决python类型转换代码_python-将PySpark dataframe 列类型转换为字符串并替换方括号所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(41)

评论列表共有 0 条评论

立即
投稿
返回
顶部