How to use Text-to-Speech voice synthesis in GCP
【Overview】Text-to-Speech is powered by Google’s AI technology. It uses the API to convert text into natural and lifelike speech. Transcription data is sent to Text-to-Speech for speech synthesis through an API call, and then the synthesized human speech in a playable audio format is received …
bucketHow to create buckets in batches on GCP
[Overview] Bucket is a storage component in Google Cloud Storage that provides you with data storage. It supports diverse data types, including videos, music, images, and files in various formats, greatly meeting the needs for data storage. At the same time, it is also a …
创建你的第一个GKE集群
【GKE简介】 GKE是谷歌推出的K8S的集群管理平台。目前推出了两种管理模式,分别是: 标准集群架构图如下: 其中蓝色部分为GKE为我们管理的部分,用户无需关注,在标准模式下,用户只需要管理node节点和pod。也就是黄色部分的内容。 Autopilot模式 对于 AutoPilot 模式的集群,GKE会管理集群的整个底层基础架构,包括控制层面、节点和所有系统组件。用户只需要管理自己的业务pod。 【概念回顾】 在我们使用GKE平台之前,我们先简单回顾一下几个概念,这样可以帮助我们更快地上手GKE平台。 pod Pod 是可以在 Kubernetes 中创建和管理的、最小的可部署的计算单元。这些容器共享存储、网络、以及怎样运行这些容器的声明。 每一个 Pod 被分配一个独立的 IP 地址。Pod 中的所有容器共享一个网络名称空间 deployment Deployment(简称deploy) 是最常用的用于部署无状态服务的方式。Deployment 控制器使得您能够以声明的方式更新 Pod(容器组)和 ReplicaSet(副本集)。 ReplicaSet ReplicaSet(简称rs)的目的是维护一组在任何时候都处于运行状态的 Pod 副本的稳定集合。因此,它通常用来保证给定数量的、完全相同的Pod 的可用性。 service service是一组具有相同功能pod的集合。 Kubernetes 中 Pod 是随时可以消亡的(节点故障、容器内应用程序错误等原因)。如果使用 Deployment 运行您的应用程序,Deployment 将会在 Pod 消亡后再创建一个新的 Pod 以维持所需要的副本数。每一个 …
数据管理之数据孤岛的治理
随着网络安全法的颁布和执行,数据安全受到越来越多的关注。各行各业对如何进行数据管理和保障数据安全提供了越来越多的方案和见解。下面我们就带你了解以下几个常见的数据管理场景。 【数据孤岛的治理】 1.1 什么是“数据孤岛”? 数据孤岛是存在于政府或企业信息化建设中很常见的一种现象,往往由于技术的局限、结构的陈旧等因素所导致。主要分为物理性和逻辑性两种:物理性数据孤岛是指,数据在不同部门相互独立存储、独立维护,彼此间相互孤立。逻辑性数据孤岛是指,不同部门站在自己的角度对数据进行理解和定义,使得一些相同的数据被赋予了不同的含义,无形中加大了跨部门数据合作的沟通成本。 下图是一个很典型的数据孤岛模型。每个部门数据各自为政。权限、数据结构、安全、备份机制、甚至是使用不同的数据库软件。这种模型下,很难进行数据的统一个有效的管理。对组织来说,每一份散落在各个部门之间的数据都是一个被上帝遗弃的孤儿,失去了数据应有的价值。同时对于组织来说,也是资源的极大浪费。严重的阻碍了组织各部门之间的工作效率。试想一下,如果我要管理这么多不同类型的数据和数据库软件,组织的运维人员需要付出多大的代价? 1.2 如何治理数据孤岛 组织消除数据孤岛的最简单方法是将其整合到数据仓库中。 Google Cloud platform的BigQuery就是一个很典型的治理数据孤岛的产品。 1. 创建脚本或者代码整合数据 利用SQL或Python编写的脚本编写代码来提取数据并将其移动到中心位置。唯一的缺点是它很耗时,需要大量的专业知识。 2. 使用ETL工具 提取、转换、加载 (ETL)工具可自动执行整个过程,从而消除移动数据的麻烦。这会从源中提取数据,执行必要的转换,然后将数据加载到接收方数据仓库。这些工具通常托管在组织内部。比如比较常用的有Kettle、Sqoop等等。•提取提取是从一个或多个来源(在线、本地、旧版、SaaS或其他)中检索数据的过程。检索或提取完成后,数据将被加载到暂存区中。•转换转换包括获取数据、清理数据并将其转换为通用格式,以便将其存储在目标数据库、数据存储区、数据仓库或数据湖中。清理通常包括删除重复、不完整或明显有错误的记录。•加载加载是将转换格式后的数据插入目标数据库、数据存储区、数据仓库或数据湖的过程。 3. 基于云的ETL工具 托管在云端的这些 ETL 工具利用 […] …
使用GKE Autopilot部署MySQL
一、登录GCP平台,点击Kubernetes Engine,选择创建GKE Autopilot集群(一个按 Pod 付费的 Kubernetes 集群) 二、创建完后可以点击Connect连接,进入Cloud Shell控制台 三、创建之前,需要创建一个Secrets,保存数据库的用户名和密码。Secret 里的值是用 base64 方式加密的,所以这里的 MYSQL_ROOT_PASSWORD,要用实际的密码用 base64 的方式加密。 1)编写一个mysql-secret.yaml文件,文件内容如下: 2)然后使用以下命令运行,运行完后也可以在页面的Secrets&ConfigMaps看到你新建的Secrets 四、创建PV和PVC 1)创建一个 StorageClass 注意:创建pvc之前可以创建一个 StorageClass,然后volumeBindingMode字段配置成Immediate,这样创建 PersistentVolumeClaim的时候,Kubernetes 会自动为您预配PV,不需要单独创建pv 编写一个pd-example-class.yaml文件,文件内容如下,然后运行kubectl get sc命令查看创建的StorageClass 2) 创建一个 pvc 编写一个pvc-example.yaml文件,文件内容如下,然后运行kubectl apply -f pvc-example.yaml命令运行创建pvc 五.部署mysql 1)编写mysql.yaml文件,然后运行kubectl apply -f mysql.yaml,kubectl get pod,kubectl get StatefulSet查看执行结果。 2)在MySQL数据库中添加数据 3)模拟MySQL服务故障 k8s集群会生产一个新的Pod,验证这个Pod内是否有之前数据。先查看运行MySQL服务的Pod在哪个节点,然后将该节点挂起,我们知道k8s肯定会在另外一个节点重新生成一个Pod。 4)新生成Pod后,同样进入Pod验证数据是否存在。 …