GVKun编程网logo

如何更快地计算Foundry“最新版本”数据集?(数据集算法)

8

此处将为大家介绍关于如何更快地计算Foundry“最新版本”数据集?的详细内容,并且为您解答有关数据集算法的相关问题,此外,我们还将为您介绍关于android–如何更新或重新安装最新版本的ADB?、A

此处将为大家介绍关于如何更快地计算Foundry“最新版本”数据集?的详细内容,并且为您解答有关数据集算法的相关问题,此外,我们还将为您介绍关于android – 如何更新或重新安装最新版本的ADB?、ASP.NET:如何更快地加载页面、Cloud Foundry Foundation构建中国开源生态、cloud foundry 数据库服务的 数据初始化 问题?的有用信息。

本文目录一览:

如何更快地计算Foundry“最新版本”数据集?(数据集算法)

如何更快地计算Foundry“最新版本”数据集?(数据集算法)

这是一种常见的模式,将从bucketing中受益。

其要点是:根据primary_key列将输出SNAPSHOT写入存储桶中,其中完全忽略了将更大的输出改组的昂贵步骤。

>

这意味着您只需要将新数据交换到已经包含先前历史记录的存储桶中即可。

让我们从初始状态开始,在该状态下,我们运行的是先前计算的“最新”版本,该版本运行速度很慢:

- output: raw_dataset
  input: external_jdbc_system
  hive_partitioning: none
  bucketing: none
  transactions:
    - SNAPSHOT
    - APPEND
    - APPEND
- output: clean_dataset
  input: raw_dataset
  hive_partitioning: none
  bucketing: none
  transactions:
    - SNAPSHOT
    - SNAPSHOT
    - SNAPSHOT

如果我们使用clean_dataset列上的存储桶将primary_key写入到单独计算的存储桶数中,以适应我们期望的数据规模,则需要以下代码:

from transforms.api import transform,Input,Output
import pyspark.sql.functions as F
from pyspark.sql.functions import row_number
from pyspark.sql.window import Window


@transform(
    my_output=Output("/datasets/clean_dataset"),my_input=Input("/datasets/raw_dataset")
)
def my_compute_function(my_input,my_output):

    BUCKET_COUNT = 600
    PRIMARY_KEY = "primary_key"
    ORDER_COL = "update_ts"

    updated_keys = my_input.dataframe("added")
    last_written = my_output.dataframe("current")

    updated_keys.repartition(BUCKET_COUNT,PRIMARY_KEY)

    value_cols = [x for x in last_written.columns if x != PRIMARY_KEY]

    updated_keys = updated_keys.select(
      PRIMARY_KEY,*[F.col(x).alias("updated_keys_" + x) for x in value_cols]
    )

    last_written = last_written.select(
      PRIMARY_KEY,*[F.col(x).alias("last_written_" + x) for x in value_cols]
    )

    all_rows = updated_keys.join(last_written,PRIMARY_KEY,"fullouter")
    
    latest_df = all_rows.select(
      PRIMARY_KEY,*[F.coalesce(
          F.col("updated_keys_" + x),F.col("last_written_" + x)
        ).alias(x) for x in value_cols]
    )

    my_output.set_mode("replace")

    return my_output.write_dataframe(
        latest_df,bucket_cols=PRIMARY_KEY,bucket_count=BUCKET_COUNT,sort_by=ORDER_COL
    )

运行该命令时,您会在查询计划中注意到该项目移至输出上不再包含交换,这意味着它将不会对数据进行改组。现在,您将看到的唯一交换是在 input 上,它需要以与格式化输出完全相同的方式分发更改(这是非常快的操作)。

然后,此交换保留在fullouter连接步骤中,然后该连接将利用此交换并快速运行600个任务。最后,我们通过在以前相同的列上显式存储到相同数量的存储桶中,来保持输出的格式。

注意:通过这种方法,每个存储桶中的文件大小会随着时间的推移而增长,而无需考虑增加存储桶数以保持文件大小的需要。最终,您将通过这种技术达到一个阈值,即文件大小超过128MB,并且您将不再高效执行(解决方案是提高BUCKET_COUNT值)。

您的输出现在将如下所示:

- output: raw_dataset
  input: external_jdbc_system
  hive_partitioning: none
  bucketing: none
  transactions:
    - SNAPSHOT
    - APPEND
    - APPEND
- output: clean_dataset
  input: raw_dataset
  hive_partitioning: none
  bucketing: BUCKET_COUNT by PRIMARY_KEY
  transactions:
    - SNAPSHOT
    - SNAPSHOT
    - SNAPSHOT

android – 如何更新或重新安装最新版本的ADB?

android – 如何更新或重新安装最新版本的ADB?

我有一个基于Android的手机,我需要ADB来安装新版本.然而,直到今天ADB工作得很好,但今天我收到了一个错误,它说“你需要1.0.32或更新的版本.”是的,错误很清楚.问题是,怎么样?

对于记录,我试图删除亚行.
用:

sudo apt-get remove android-tools-adb android-tools-fastboot

然后我重新安装它:

sudo apt-get install android-tools-adb android-tools-fastboot

在此命令之前,我的ADB版本是1.0.31,仍然是1.0.31.但在这里(http://developer.android.com/sdk/index.html#Other)据我所知,有新版本,1.0.35.但是终端所有我得到的是1.0.31.
我已经下载了1.0.35 zip,但我不知道如何处理它.

我如何升级我的亚行?

解决方法:

您可以下载最新的SDK,包括adb here.当您提取此存档时,有一个自述文件说明如何安装SDK.我在此列出供您参考.

Welcome to the Android SDK!

The Android SDK archive initially contains only the basic SDK tools. It does
not contain an Android platform or any third-party libraries. In fact, it
doesn't even have all the tools you need to develop an application.

In order to start developing applications, you must install the Platform-tools
and at least one version of the Android platform, using the SDK Manager.

Platform-tools contains build tools that are periodically updated to support new
features in the Android platform (which is why they are separate from basic
SDK tools), including adb, dexdump, and others.

To install Platform-tools, Android platforms and other add-ons, you must
have an Internet connection, so if you plan to use the SDK while
offline, please make sure to download the necessary components while online.

To start the SDK Manager, please execute the program "android".

From the command-line you can also directly trigger an update by
executing:
  tools/android update sdk --no-ui

Tip: use --help to see the varIoUs command-line options.


For more information, please consult the Android web site at
  http://developer.android.com/sdk/

一旦安装(你必须安装Java,如果你还没有),你可以导航到android-sdk-linux / platform-tools并通过输入从那里执行adb

./adb [options]

我承认这可能不是最优雅的解决方案,但它对我有用. ISTR,在一台不同的Ubuntu机器上,我只使用平台工具管理了一个最小的安装,但是我找不到我的笔记.

ASP.NET:如何更快地加载页面

ASP.NET:如何更快地加载页面

我们用ASP.NET编写了Portal.但它有许多 Javascripts,我们的页面加载缓慢.
在某些页面中,页面大小为1.5 MB!
减少或压缩页面大小以使其更快的最佳方法是什么?
谢谢

解决方法

几件事:

>最小化您的JavaScript和CSS文件. JS为Google has a nice minimizer.
>缓存图像,js文件和css文件.有关如何从IIS,here执行此操作的信息.
>如果您可以或至少仅在需要它的控件上启用它,请禁用ViewState.
>在IIS上使用压缩
>使用内容交付网络(CDN)提供javascript库等javascript库.
>使用Smush.it优化图像
>将javascript代码放在页面底部,以便页面开始渲染更快
>如果您使用JSON进行UI和后端之间的数据交换,请确保也压缩它.
>使用sprite me为您的图像图标,背景等创建精灵.

Cloud Foundry Foundation构建中国开源生态

Cloud Foundry Foundation构建中国开源生态


开源的热度在中国是越来越高。6月25-27日,LC3(LinuxCon + ContainerCon + CloudOpen)大会第二次在中国召开,超过2000多名开发者及业内人士汇集到了国家会议中心,热烈地讨论着开源的各种问题。

 

作为全球最广泛应用的开源云技术基金会Cloud Foundry Foundation的执行董事,Abby Kearns也专程从美国来到LC3大会,寻求与中国产业界更广泛的合作。


(Cloud Foundry Foundation执行董事Abby Kearns)


正在加入的中国云服务商

 

就在前不久,Cloud Foundry Foundation宣布与中国最大的公有云服务商阿里云达成合作。阿里云将为Cloud Foundry平台提供全面技术集成支持。作为中国最大的云基础设施提供商及全球三大云基础设施巨头之一, 阿里云还将加入安联保险、美国航空、福特、谷歌、微软和瑞士电信的行列,正式成为Cloud Foundry Foundation的金牌会员。



此次合作的达成,实现了阿里云和Cloud Foundry之间的无缝交互。通过为Cloud Foundry BOSH 创建的Cloud Provider Interface(CPI接口,现在开发者们可以在阿里云上同时访问Cloud Foundry Application Runtime(CFAR)和Cloud Foundry Container Runtime(CFCR)的负载。其中CFCR 是Cloud Foundry Foundation基于Kubernetes和BOSH技术开发和维护的一个支持容器架构的平台核心组件。

 

“作为金牌会员,阿里云会成为Cloud Foundry Foundation技术委员会的一员,还可以通过投票的方式选举或被选举为董事会成员。另外,阿里云还可以参与影响Cloud Foundry的技术路线及未来发展方向。”对于阿里云的加入,Abby Kearns表示了热烈的欢迎。她透露,由于跟阿里云的理念非常一致,双方很快就达成了共识。在交流的过程中,阿里云对CPI等相关程序的开发也很积极,提前进行了相关部署。

 

作为合作的另一方,阿里云首席架构师唐洪表示:“作为业界第一个开源PaaS平台,Cloud Foundry适用于多种云、多种框架和多种语言。这与阿里云致力于为客户提供多种选择的理念十分契合。同时,阿里云将一如既往地致力于为开源社区做贡献。”

 

阿里巴巴一直开源届做贡献。阿里巴巴第一批开源项目始于 2011年。目前阿里巴巴的开源项目以及其维护的开源项目总计超过150个,涵盖中间件、开发框架、数据库和各种工具类软件。其中Weex、Ant Design、Dubbo、Fastjson 在GitHub上Star已经破万,Alibaba在GitHub上Star数超过170000,组织排名前十。



随着阿里云的加入,目前Cloud Foundry基于容器的架构,已经能够在阿里云、Amazon Web Services (AWS)、Google Cloud Platform(GCP)、IBM Cloud、Microsoft Azure、OpenStack、VMware vSphere等各大云平台上运行了。

 

中国厂商除了阿里云之外,华为也在更早时候加入Cloud Foundry Foundation并成为金牌会员,另一家中国公司MoPaaS则是银牌会员。

 

Abby Kearns还表示,作为一家开放、开源的平台,Cloud Foundry Foundation希望并计划跟中国境内所有的云服务商达成合作。“接下来我们也会跟其他云服务商进行接触,目前正在跟腾讯、百度等进行积极的洽谈。”

 

服务、集成商、能力,一个都不能少

 

在美国,除了戴尔EMC、谷歌、IBM、微软、Pivotal、SAP和SUSE等大型科技公司之外,很多传统行业的大公司也都在使用Cloud Foundry。目前Cloud Foundry已被制造业、电信和金融服务等领域的领军企业广泛采用。与阿里云一样是金牌会员的,就有安联保险、美国航空、福特汽车、瑞士电信等传统企业。目前在银行业这个领域,全球500强企业里超过90%的银行都是Cloud Foundry的用户。

 

Abby Kearns透露,从全球来看,Cloud Foundry的用户中有61%是大型企业,14%为中型企业,还有25%则是小型企业。“大型企业用户可能倾向于与我们大的会员单位合作,小的可能倾向于找一些小的会员单位合作,或者是把软件拿来自己研究和使用,就看公司的倾向性了。”在中国,已经有一些传统行业的大型企业采用Cloud Foundry做PaaS云服务,如招商银行和中信证券,他们都是将自己的核心业务应用跑在Cloud Foundry的PaaS云平台上面。她表示,她有信心会有越来越多的中国企业了解并采用Cloud Foundry。



Abby认为要想进一步推动开源技术及社区在中国的发展,还需在本土培养大量的开源人才。正因如此,Cloud Foundry Foundation除了与中国各大科技公司加强合作之外,还吸收了多彩贵州公司成为银牌会员。作为中国云计算和云服务高地的贵州,正在加紧扶植和培养相关人才。Cloud Foundry Foundation与多彩贵州公司合作,最大的目的就是培养人才。

 


“我们希望在未来看到更多的中国开发者参与进来。不只是Cloud Foundry,我们希望所有的开源社区都能够让中国的开发者更多地来参与到社区开发中来。”Abby Kearns认为,中国有着很大的人才库,只要解决了语言的瓶颈,就能够更多地参与开源社区的建设中来。

 

服务、集成商、能力,是Abby Kearns认为Cloud Foundry作为一个平台必须做好的三件大事。如今进入中国,同样也是如此。“中国的数字化转型刚刚开始,云原生的概念也正在兴起,整个产业链上会产生非常非常多的机会,要把中国市场做好,三个方面的提升都非常重要。其实,这就是建立完整生态系统的概念,开源在美国之所以如此成功,关键就在于生态系统的建设。

 

目前Cloud Foundry有很大一部分源代码是托管在全球最大的开源代码社区GitHub上面的。谈及前不久软件巨头微软宣布收购GitHub,Abby认为这释放了一个非常积极的信号,表明了整个行业将更积极地拥抱开源,是对开源社区的一种推动,对开发者来讲也是一件好事



在加入Cloud Foundry Foundation之前,Abby Kearns是Pivotal产品管理团队的一员,主管Pivotal Cloud Foundry项目,它也是Cloud Foundry Foundation的前身。她表示,从商业公司转而加入非盈利机构,使她可以站在科技的最前沿,以更高的角度看整个互联网科技的发展

 

“加入Cloud Foundry Foundation对我来说还有一个好处,让我有机会来中国。”Abby Kearns笑着说道,“中国,或者整个来讲亚洲,代表的是下一个互联网发展的高峰,未来的机会在亚洲。



如果希望与老冀有更多交流,请加老冀个人微信:rouqinghufa,或者直接扫描以下二维码:

本文分享自微信公众号 - LFAPAC(gh_8442c14fe49e)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

cloud foundry 数据库服务的 数据初始化 问题?

cloud foundry 数据库服务的 数据初始化 问题?

情况是这样的,我在 cloud foundry 上部署了一个web工程,绑定了mysql数据库服务,也得到了mysql的基本json信息,我想初始化mysql数据,怎么弄,必须Java实现还是?数据库的备份,更新以及删除,如果有客户端工具可以连接的话,是不是更方便。

关于如何更快地计算Foundry“最新版本”数据集?数据集算法的介绍现已完结,谢谢您的耐心阅读,如果想了解更多关于android – 如何更新或重新安装最新版本的ADB?、ASP.NET:如何更快地加载页面、Cloud Foundry Foundation构建中国开源生态、cloud foundry 数据库服务的 数据初始化 问题?的相关知识,请在本站寻找。

本文标签:

上一篇给定无向图设计算法(设无向图g,要求给出)

下一篇如何在Laravel刀片上计算