当前位置: 首页 > article >正文

用 Python 实现近实时闪电数据可视化

我们有各种工具和方法来测量闪电的位置、时间和形状。在本文中,我将简要介绍不同检测方法的工作原理。在第二部分,我还将介绍一段 Python 代码,向您展示如何实时可视化闪电数据。这些数据来自 MTG-LI 的预发布版本,MTG-LI 是第三代气象卫星 MTG 所携带的闪电成像仪设备。 

我们如何探测闪电?

手动检测 

人们可以坐在远处的山顶上,安全地数着它们,记下时间、数字,描述闪光的形状。虽然这种方法最简单、最便宜,但也有很多弊端:
覆盖范围有限
高频雷暴的低效率
无法全天候运行
无法估计闪光强度

自动检测

重要的是要明白,闪电不仅仅是一道闪光。它是一种放电现象,不仅发出可见光,还发出人眼无法看到的不同频率的电波。

据欧洲气象卫星组织称,"闪电是电磁频谱中不同类型信号的来源,具体包括:甚高频信号(VHF)、甚低频信号(VLF)、低频信号(LF)以及光脉冲:甚高频信号(VHF)、甚低频信号(VLF)、低频信号(LF)以及光脉冲。这些信号可由不同类型的仪器探测到,并可用于确定闪电的时空位置及其物理特征。不同的仪器能够检测到上述闪电类别的一部分或全部"。

不同类型的闪电会发出不同频率的信号。我们可以看到从云层向下传播到地面的闪电,称为云对地(CG)闪电;也可以看到发生在云层中的闪电,称为云内(IC)闪电。云对地闪电通常会发出在甚低频 (VLF) 和低频 (LF) 范围内可探测到的信号,而云中闪电通常会发出在甚高频 (VHF) 范围内的信号。

地面探测

由于我们知道应该寻找哪些频率,因此可以通过放置在地面上的天线探测闪电。像 LINET 这样的地面网络通常可以探测到大多数闪电事件。同样,有些人可能知道一个网站--Blitzortung。该网站提供近乎实时的闪电地图,由其自己的地面站网络生成。

这些网络使用三角测量法--如果至少有 3 个站点在不同的时间戳中检测到相同的信号,就可以计算出闪电事件的精确位置。

从太空进行探测

欧洲气象卫星应用组织(EUMETSAT)最近预先发布了闪电成像仪(LI)的数据--这是该组织最新的一颗地球静止卫星上安装的仪器。这颗卫星被称为第三代气象卫星(MTG),搭载了许多仪器,用于积极、精确、最重要的是,经常监测欧洲、非洲、大西洋和巴西部分地区的天气情况。

该仪器与使用光学传感器探测闪电的地面站相比,具有更强的探测能力。我们为什么需要它?

虽然地基系统可以探测到大多数闪电事件,但网络相当稀疏,覆盖范围也不是全球性的。通常,探测网络覆盖较大的国家或大陆,但在人烟稀少的地区,根本没有足够的站点来探测闪电。地球静止卫星一直位于赤道上方,与地球的自转速度相匹配,这使它们看起来停留在一个地方。这使它们能够持续观测大面积区域--与地面网络相比具有很大优势。

另一个好处是,虽然地面站可以探测到大多数闪光,但其弱点在于探测集成电路闪光。集成电路闪光通常更难被地面网络探测到,因为它们不会产生远距离传播的强无线电波。通过直接探测光发射,LI 可以有效地捕捉到这些闪光。

如果您想了解有关闪电成像仪的更多信息,请访问 Eumetsat 网站。我只想说一句我认为与本文相关的话。

闪电成像仪有四台相机,每台相机每秒可拍摄 1,000 幅图像,无论白天黑夜,即使是一道闪电,其探测速度也比眨眼还快,"闪电成像仪项目工程经理 Guia Pastorini 说,"闪电成像仪有四台相机,每台相机每秒可拍摄 1,000 幅图像,无论白天黑夜,即使是一道闪电,其探测速度也比眨眼还快,"。

用 Python 可视化近实时数据

正如文章标题所示,我不仅要解释我们是如何探测闪电的,还要说明我们是如何获得最新发布的数据的。我们的最终目标是将闪电成像仪探测到的每一道闪电的位置和时间可视化。

第一步,我们需要获取数据。为此,您需要在 Eumetsat 上注册,以访问其数据存储。登录后(可在右上角登录),点击 API Key。显示您的密钥和秘密的页面将出现,复制您的消费者密钥和消费者秘密并保存到某个安全位置,因为我们将在 Python 脚本中使用它。

让我们从编码开始。首先,我们需要安装所需的库。创建 Anaconda 环境并安装必要的库:

conda install -c conda-forge satpy xarray h5py pandas matplotlib eumdac requests

安装完成后,我们需要定义连接数据存储的凭据。

# Import EUMDAC and dependent libraries to begin
import eumdac
import datetime
import shutil
import requests

# Insert your personal key and secret into the single quotes
consumer_key = '<your-consumer-key>'
consumer_secret = '<your-consumer-secret>'

credentials = (consumer_key, consumer_secret)

token = eumdac.AccessToken(credentials)

print(f"This token '{token}' expires {token.expiration}")

# >> This token '<some-token>’ expires 2024-07-31 21:12:19.757560

下载数据

二级闪电数据有三种类型--闪电事件、闪烁和群组。您可以在此相关信息,但在本文中,我们将对闪烁进行可视化处理。要将数据下载到 point_data 目录中,请运行以下代码:

datastore = eumdac.DataStore(token)

import os
import zipfile
from io import BytesIO
from concurrent.futures import ThreadPoolExecutor, as_completed

# Assume datastore is already defined and connected
searchs = datastore.opensearch("""pi=EO:EUM:DAT:0691&dtstart=2024-07-30T22:00:00&dtend=2024-07-31T22:00:00""")

# Create the data directory if it doesn't exist
os.makedirs("point_data", exist_ok=True)

def download_and_extract(product):
    try:
        # Create a temporary BytesIO object to hold the downloaded zip file
        with product.open() as fsrc:
            with BytesIO(fsrc.read()) as bio:
                with zipfile.ZipFile(bio, 'r') as zip_ref:
                    # Check if all the files to be extracted already exist
                    all_files_exist = all(os.path.exists(os.path.join("point_data", name)) for name in zip_ref.namelist())
                    if all_files_exist:
                        print(f"All files already exist, skipping download for product: {product}")
                        return
                    # Extract all the contents into the data directory
                    zip_ref.extractall("point_data")
                    print(f'Extracted product finished.')
    except Exception as e:
        print(f"Failed to process product: {e}")

# Use ThreadPoolExecutor to handle concurrency
with ThreadPoolExecutor(max_workers=5) as executor:
    futures = {executor.submit(download_and_extract, product): product for product in search}
    for future in as_completed(futures):
        product = futures[future]
        try:
            future.result()
        except Exception as e:
            print(f"Exception occurred while processing product: {e}")

print("All products processed.")

请注意 opensearch 中的定义,您可以更改以 UTC 时间为单位的开始日期时间和结束日期时间,而 EO:EUM:DAT:0691 则描述了与闪存产品相关的产品 ID。请记住这个 ID,因为将来可能会用它来搜索产品。

这将创建名为 point_data 的新文件夹,在该文件夹中,你应该能看到一些元数据文件和提取的 NetCDF 文件(*.nc)。

数据可视化

为了使数据可视化,我们将使用奇妙的 satpy 库,这是一个用于读取和处理气象遥感数据并将其写入各种图像和数据文件格式的 python 库。

我们的目标是创建一个闪烁动画,其中包含过去一小时内 5 分钟的闪烁滑动窗口。这个动画不仅能提供闪电的位置,还能直观地显示移动风暴的轨迹。

让我们先了解一下我们要处理的数据。首先,我们需要用 satpy 加载数据并将其转换为 xarray 数据集,然后再转换为 pandas 数据帧

from glob import glob
import os

import cartopy.crs as ccrs
import cartopy.feature as cfeature
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import seaborn as sns
from satpy import Scene, MultiScene
import matplotlib.patheffects as path_effects


scn = Scene(filenames=glob("point_data/*001.nc"), reader="li_l2_nc",)
scn.load(scn.available_dataset_names())

ds = scn.to_xarray_dataset()
df = ds.to_dataframe()

# Get longitude and latitude from metadata
df["lon"], df["lat"] = ds["number_of_events"].attrs["area"].get_lonlats()

# Drop columns that we will not need
df = df.drop(columns=["flash_filter_confidence"])

# Drop null values (if any)
df.dropna(inplace=True)

# Convert flash_time to datetime
df["flash_time"] = pd.to_datetime(df["flash_time"])
df = df[["flash_time", "lon", "lat"]]
print(df.head())

这就是您应该看到的内容。我们主要对 flash_time、lon 和 lat 列感兴趣,因为本文只需要它们。

        flash_time        lon     lat
y                                                 
0 2024-07-30 21:50:06.014499968 -62.972103 -1.6875
1 2024-07-30 21:50:08.016100096 -64.219505 -2.0115
2 2024-07-30 21:50:08.174100096 -67.124702 -0.7830
3 2024-07-30 21:50:09.224099968 -62.880302 -1.8090
4 2024-07-30 21:50:09.370099968 -65.321098 -2.7162

 

接下来我们要做的是

  1. calculate new column called bin_5min — a column that will convert flash_time to 5-minute intervals,
    计算名为 bin_5min 的新列 - 将 flash_time 转换为 5 分钟间隔的列、
  2. iterate over unique 5-minute intervals,
    迭代 5 分钟的独特时间间隔、
  3. for each unique 5-min interval, take that interval minus 1 hour from the dataframe,
    对于每个独特的 5 分钟时间间隔,从数据帧中提取该时间间隔减去 1 小时、
  4. for each unique 5-min interval, calculate minute difference between max(bin_5min) and bin_5min,
    对于每个唯一的 5 分钟间隔,计算 max(bin_5min) 和 bin_5min 之间的分钟差、
  5. for each unique 5-min interval, generate map with last 60 minutes flashes.
    为每个独特的 5 分钟间隔,生成最近 60 分钟闪烁的地图

请注意,我们将重点关注法国北部地区,在撰写本文时,2024 年夏季奥运会正在该地区举行。7 月 31 日期间,整个地区都出现了强雷暴天气。

# Create 5 min bins
df["bin_5min"] = df["flash_time"].dt.floor("5min")

# Define plot function
def plot_df(df, minute):
    # Define the map projection
    projection = ccrs.Mercator()
    crs = ccrs.PlateCarree()

    # Create a new figure with a high DPI for better resolution
    plt.figure(dpi=350)
    ax = plt.axes(projection=projection, frameon=True)

    # Set the geographical extent of the map (bounding box)
    # for northern France
    lon_min = -6
    lon_max = 9
    lat_min = 46
    lat_max = 52
    ax.set_extent([lon_min, lon_max, lat_min, lat_max])

    # Add land and border features to the map
    ax.add_feature(cfeature.LAND.with_scale("10m"), facecolor="black")
    ax.add_feature(cfeature.BORDERS.with_scale("10m"), lw=0.3, color="white")
    ax.coastlines()

    # Add Paris location with a small red dot and a label
    paris_lon, paris_lat = 2.3522, 48.8566
    txt = ax.plot(paris_lon, paris_lat, '.', color='red', markersize=3, transform=ccrs.PlateCarree(), zorder=6)
    # Add white outline to the red dot for better visibility
    txt[0].set_path_effects([path_effects.withStroke(linewidth=1, foreground="w", alpha=0.8)])

    # Add a text label for Paris with a white background and black outline
    text = ax.text(
        paris_lon, paris_lat, ' Paris', fontsize=8, alpha=1, ha='left', va='bottom',
        bbox=dict(facecolor='white', alpha=0.1, pad=0.0, edgecolor='none'),
        transform=ccrs.PlateCarree(), zorder=6
    )
    text.set_path_effects([path_effects.withStroke(linewidth=1.5, foreground="w", alpha=0.9)])

    # Plot the data points on the map using seaborn's scatterplot
    sns.scatterplot(
        x="lon",
        y="lat",
        data=df,
        edgecolor=None,
        transform=ccrs.PlateCarree(),
        hue="min_ago",
        palette="YlOrBr",
        s=1,
        ax=ax,
        marker="+",
        hue_norm=(0, 60),
        legend=False,
        linewidths=0.6
    )
    
    # Set the title of the plot with the current minute
    ax.set_title(f"{minute:%Y-%m-%d %H:%M}")
    # Save the plot as a PNG file in the specified directory
    plt.savefig(f"minute5_lightning/{minute:%Y-%m-%d__%H%M}.png")
    # Adjust layout to prevent clipping of elements
    plt.tight_layout()
    # Close the plot to free memory
    plt.close()

# Iterate over unique 5-minute intervals
os.makedirs("minute5_lightning", exist_ok=True)

for minute in df["bin_5min"].unique():
    h1_ago = minute - pd.Timedelta(hours=1)
    h5_df = df[(df["bin_5min"] >= h1_ago) & (df["bin_5min"] <= minute)]
    h5_df["min_ago"] = (h5_df["bin_5min"].max() - h5_df["bin_5min"]).dt.seconds / 60
    plot_df(h5_df, minute)

 这将在 minute5_lightning 目录中生成大量 .png 图像。我们可以随意处理这些图片,例如制作动画视频。

我们还可以使用我们的数据帧生成闪电闪烁的每小时总和。

# Setting the index and creating the flash_count column in one step
df_orig = df.set_index('flash_time').assign(flash_count=1)

# Resampling to hourly sums
hourly_sums = df_orig['flash_count'].resample('H').sum().reset_index()

# Creating bar plot
plt.figure(figsize=(12, 6))
sns.barplot(x='flash_time', y='flash_count', data=hourly_sums, palette='viridis')
plt.xticks(rotation=45)
plt.title('Hourly Sums of Flash Counts')
plt.xlabel('Timestamp')
plt.ylabel('Sum of Flash Counts')
plt.show()

或可视化原始数据中的其他列,如每小时的辐射分布。

import matplotlib.ticker as ticker

# Creating violin plot of 'log_radiance' by hour
plt.figure(figsize=(12, 6))
sns.violinplot(x='hour', y='log_radiance', data=df_orig.reset_index(), palette='viridis')

# Setting yticks to reflect the log scale
def log_format(x, pos):
    return f'{np.exp(x):.1f}'

plt.gca().yaxis.set_major_formatter(ticker.FuncFormatter(log_format))

plt.xticks(rotation=45)
plt.title('Hourly Distribution of Radiance')
plt.xlabel('Hour of the Day')
plt.ylabel('Radiance')
plt.show()

或者在按小时上色时,将所有闪烁都可视化(我不会分享代码,这样您就可以锻炼身体了):)

 


http://www.kler.cn/a/518201.html

相关文章:

  • Django 多环境配置实战指南
  • 嵌入式实时操作系统
  • 【Numpy核心编程攻略:Python数据处理、分析详解与科学计算】1.10 文本数据炼金术:从CSV到结构化数组
  • HBase-2.5.10 伪分布式环境搭建【Mac】
  • 大模型学习计划
  • 基于 Node.js 的天气查询系统实现(附源码)
  • Linux C\C++编程-Linux系统的字符集
  • Anybus网关EtherNet/IP扫描器:快速、可靠、易配置的新一代网关
  • 使用CSS快速居中div的七种方法
  • 基于C语言的数组从入门到精通
  • Linux关于华为云开放端口号后连接失败问题解决
  • 2025美赛数学建模B题:管理可持续旅游——思路+代码+模型
  • 全面评测 DOCA 开发环境下的 DPU:性能表现、机器学习与金融高频交易下的计算能力分析
  • (2024,MLLM,Healthcare,综述)多模态学习是否已在医疗保健领域实现通用智能?
  • 前端三件套详解之 HTML
  • 将.bmp文件转为.jpg文件
  • JavaSec系列 | 动态加载字节码
  • LInux配置PXE 服务器
  • 【重磅AI论文】DeepSeek-R1:通过强化学习激励大语言模型(LLMs)的推理能力
  • BLE透传方案,IoT短距无线通信的“中坚力量”
  • 可视化任务调度框架:15个热门.Net开源项目
  • VsCode安装文档
  • 二叉树的最大深度(C语言详解版)
  • 【读书笔记·VLSI电路设计方法解密】问题44:什么是代码覆盖率
  • 2013年蓝桥杯第四届CC++大学B组真题及代码
  • ssh密钥登录GitHub时一直提示“Error: Permission denied (publickey)”