1 TODO

Have a set where we merge 2.1/2.2, 2.3/2.4.
Represent the transition from a global view of the samples without any classification, then state the subpopulations/zymodemes, then add sensitivity/resistance, then cure/fail.
Perhaps make an explicit plot where all samples are one color excepting a relatively small number of previously assayed set? The samples which would be colored in this view would be from Olga’s 2014 paper I think.
Make a flow diagram going from s/r -> subpopulation -> c/f/u. (sankey)
Make a table similar to the TMRC3 containing the statuses of the samples.
Explicitly consider metadata column ‘P’ for reference strains – make an all grey plot with a few samples colored taken from this column.

2 Changelog

2.1 20230524/20230628

Frozen metadata, now using sample sheet ‘ClinicalStrains_TMRC2_Frozen 21062023.xlsx’

2.2 20230410

Updating the version number due to some moderately intrusive changes I made in order to more carefully create plots of the differential expresison data. I don’t think anything I did should actually change any of the data, but some of the analyses are definitely affected (note that the only change in results is due to a mistake I made in defining one of the contrasts, all other changes are just plot aesthetic improvements)

2.3 20230205

Did the stuff on this morning’s TODO which came out of this morning’s meeting: do a PCA without the oddball strains (already done in the worksheet), highlight reference strains, and add L.major IDs and Descriptions (done by appending a collapsed version of the ortholog data to the all_lp_annot data).
Fixed human IDs for the macrophage data.
Changed input metadata sheets: primarily because I only remembered yesterday to finish the SL search for samples >TMRC20095. They are running now and will be added momentarily (I will have to redownload the sheet).
Setting up to make a hclust/phylogenetic tree of strains, use these are reference: 2168(2.3), 2272(2.2), for other 2.x choose arbitrarily (lower numbers are better).
Added another sanitize columns call for Antimony vs. antimony and None vs. none in the TMRC2 macrophage samples.

3 Introduction

This document is intended to create the data structures used to evaluate our TMRC2 samples. In some cases, this includes only those samples starting in 2019; in other instances I am including our previous (2015-2016) samples.

In all cases the processing performed was:

Default trimming was performed.
Hisat2 was used to map the remaining reads against the Leishmania panamensis genome revision 36.
The alignments from hisat2 were used to count reads/gene against the revision 36 annotations with htseq.
These alignments were also passed to the pileup functionality of samtools and the vcf/bcf utilities in order to make a matrix of all observed differences between each sample with respect to the reference.
The freebayes variant estimation tool was used in addition to #4 to search for variant positions in a more robust fashion.
The trimmed reads were passed to kraken2 using a viral database in order to look for samples with potential LRV sequence.
An explicit, grep-based search for spliced leader reads was used against all human-derived samples. The results from this were copy/pasted into the sample sheet.

4 Notes 20221206 meeting

I am thinking that this meeting will bring Maria Adelaida fully back into the analyses of the parasite data, and therefore may focus primarily on the goals rather than the analyses?

Maria Adelaida meeting with Olgla/Mariana: integrating transcriptomics/genomics question.
Paper on relationship btwn primary metadata factors via transcriptome/genome.
Second on drug susceptibility without those factors (I think this means the macrophages)
Definition of species? MAG: Define consensus sequences for various strains/species. We effectively have this on hand, though the quality may be a little less good for 2.3.
Resulting goal: Create a tree of the strains (I am just going to call zymodemes strains from now on). ** What organisms would we include in a tree to describe these relationships: guyanensis, braziliensis 2904, 2.2, 2.3, 2.1, 2.4, panamensis reference, peruviania(sp? I have not seen this genome), panama, 2903; actually this may be tricky because we have always done this with a specific reference strain (panamensis col) which is one of the strains in the comparison. hmm… ** Check the most variant strains for identity (Luc) ** Methods for creating tree, traditional phylogeny vs. variant hclust?
PCR queries, works well if one performs sanger sequencing.

4.1 Multiple datasets

In a couple of important ways the TMRC2 data is much more complex than the TMRC3:

It comprises multiple, completely separate queries:
1. Sequencing the parasite samples
2. Sequencing a set of human macrophage samples which were infected with specific parasite samples.
The parasite transcriptomic samples comprise multiple different types of queries:
1. Differential expression to look at strain, susceptibility, and clinical outcomes.
2. Individual variant searches to look for potentially useful SNPs for classification of parasite samples.
The human macrophage samples may be used to query both the host and parasite transcriptomes because (at least when not drug treated) there is a tremendous population of parasite reads in them.

4.2 Sample sheet(s)

Our shared online sample sheet is nearly static at the time of this writing (202209), I expect at this point the only likely updates will be to annotate some strains as more or less susceptible to drug treatment.

sample_sheet <- "sample_sheets/ClinicalStrains_TMRC2.xlsx"
macrophage_sheet <- "sample_sheets/tmrc2_macrophage_samples.xlsx"

4.2.1 Modify the sample sheet

The following block provides an example invocation of how I automatically extract things like percent reads mapped/trimmed/etc from the logs produced by trimomatic/cutadapt/hisat/salmon/etc. The caveat is that this container only has a small portion of the material available in the main working tree, as a result the new columns added to the sample sheet are relatively sparse compared to what I get on my computer.

In addition, because these samples have gone through ~ 3 different versions of my pipeline, and the code which extracts the numbers explicitly assumes only the most recent version (because it is the best!), it does not get out the data for all the samples.

modified <- gather_preprocessing_metadata(sample_sheet, species = "lpanamensis_v36")

## Checking the state of the condition column.

## Checking the state of the batch column.

## Checking the condition factor.

## preprocessing/TMRC20001/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20002/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20065/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20004/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20005/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20066/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20039/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20037/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20038/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20067/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20068/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20041/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20015/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20009/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20010/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20016/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20011/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20012/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20013/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20017/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20014/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20018/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20019/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20070/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20020/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20021/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20022/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20024/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20036/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20069/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20033/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20026/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20031/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20076/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20073/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20055/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20079/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20071/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20078/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20094/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20042/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20058/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20072/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20059/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20048/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20057/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20088/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20056/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20060/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20077/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20074/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20063/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20053/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20052/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20064/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20075/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20051/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20050/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20049/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20062/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20110/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20080/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20043/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20083/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20054/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20085/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20046/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20093/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20089/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20047/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20090/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20044/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20045/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20105/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20108/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20109/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20098/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20096/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20101/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20092/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20082/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20102/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20099/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20100/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20091/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20084/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20087/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20103/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20104/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20086/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20107/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20081/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz
## preprocessing/TMRC20095/outputs/*hisat*_lpanamensis_v36/lpanamensis_v36_*genome*_gene_ID_fcounts.csv.xz

## Writing new metadata to: sample_sheets/ClinicalStrains_TMRC2_modified.xlsx

5 Annotations

Everything which follows depends on the Existing TriTrypDB annotations revision 46, circa 2019. The following block loads a database of these annotations and turns it into a matrix where the rows are genes and columns are all the annotation types provided by TriTrypDB.

The same database was used to create a matrix of orthologous genes between L.panamensis and all of the other species in the TriTrypDB.

The same database of annotations also provides mappings to the set of annotated GO categories for the L.panamensis genome along with gene lengths.

The following block assumes one has access to tritrypdb.org, which is no currently guaranteed. Thus I bundled a pre-generated copy of the genome, Txdb, and annotations.

## meta <- download_eupath_metadata(webservice = "tritrypdb", eu_version = "v46")
meta <- download_eupath_metadata(webservice = "tritrypdb")
panamensis_entry <- get_eupath_entry("MHOM", metadata = meta[["valid"]])
panamensis_db <- make_eupath_orgdb(panamensis_entry)
panamensis_pkg <- panamensis_db[["pkgname"]]
package_name <- panamensis_db[["pkgname"]]
if (is.null(panamensis_pkg)) {
  panamensis_pkg <- panamensis_db[["orgdb_name"]]
  package_name <- panamensis_pkg
}
tt <- library(panamensis_pkg, character.only = TRUE)
panamensis_pkg <- get0(panamensis_pkg)
all_fields <- columns(panamensis_pkg)
all_lp_annot <- sm(load_orgdb_annotations(panamensis_pkg, keytype = "gid"))

lp_go <- load_orgdb_go(package_name)
lp_go <- lp_go[, c("GID", "GO")]
lp_lengths <- all_lp_annot[, c("gid", "annot_cds_length")]
colnames(lp_lengths)  <- c("ID", "length")
all_lp_annot[["annot_gene_product"]] <- tolower(all_lp_annot[["annot_gene_product"]])
orthos <- sm(extract_eupath_orthologs(db = panamensis_pkg))
data_structures <- c(data_structures, "lp_lengths", "lp_go", "all_lp_annot", "meta")

all_installed <- rownames(installed.packages())
candidates <- grepl(pattern = "^org.Lpanamensis.MHOM.*v68.eg.db", x = all_installed)
orgdb_pkg_name <- all_installed[candidates]

tt <- library(orgdb_pkg_name, character.only = TRUE)

## Loading required package: AnnotationDbi

## Loading required package: stats4

## Loading required package: Biobase

## Welcome to Bioconductor
## 
##     Vignettes contain introductory material; view with
##     'browseVignettes()'. To cite Bioconductor, see
##     'citation("Biobase")', and for packages 'citation("pkgname")'.

## Loading required package: IRanges

## Loading required package: S4Vectors

## 
## Attaching package: 'S4Vectors'

## The following objects are masked from 'package:dplyr':
## 
##     first, rename

## The following object is masked from 'package:utils':
## 
##     findMatches

## The following objects are masked from 'package:base':
## 
##     I, expand.grid, unname

## 
## Attaching package: 'IRanges'

## The following object is masked from 'package:glue':
## 
##     trim

## The following objects are masked from 'package:dplyr':
## 
##     collapse, desc, slice

## 
## Attaching package: 'AnnotationDbi'

## The following object is masked from 'package:dplyr':
## 
##     select

##

panamensis_pkg <- get0(orgdb_pkg_name)
all_fields <- columns(panamensis_pkg)
all_lp_annot <- sm(load_orgdb_annotations(panamensis_pkg, keytype = "gid"))$genes

lp_go <- load_orgdb_go(panamensis_pkg)

## The chosen keytype was not available.  Using 'GID'.

## This is an orgdb, good.

## 'select()' returned 1:many mapping between keys and columns
## 'select()' returned 1:many mapping between keys and columns

lp_go <- lp_go[, c("GID", "GO")]
lp_lengths <- all_lp_annot[, c("gid", "annot_cds_length")]

## Error in `[.data.frame`(all_lp_annot, , c("gid", "annot_cds_length")): undefined columns selected

colnames(lp_lengths)  <- c("ID", "length")

## Error: object 'lp_lengths' not found

all_lp_annot[["annot_gene_product"]] <- tolower(all_lp_annot[["annot_gene_product"]])

## Error in `[[<-.data.frame`(`*tmp*`, "annot_gene_product", value = character(0)): replacement has 0 rows, data has 8778

data_structures <- c(data_structures, "lp_lengths", "lp_go", "all_lp_annot", "meta")

5.1 Repeat for the L.major annotations

Recently there was a request to include the Leishmania major gene IDs and descriptions. Thus I will extract them along with the orthologs and append that to the annotations used.

Having spent the time to run the following code, I realized that the orthologs data structure above actually already has the gene IDs and descriptions.

Thus I will leave my query in place to extract the major annotations, but follow it up with a collapse of the major orthologs and appending of that to the panamensis annotations.

orgdb <- "org.Lmajor.Friedlin.v49.eg.db"
tt <- sm(library(orgdb, character.only = TRUE))
major_db <- org.Lmajor.Friedlin.v49.eg.db
all_fields <- columns(pan_db)
all_lm_annot <- sm(load_orgdb_annotations(
    major_db,
    keytype = "gid",
    fields = c("annot_gene_entrez_id", "annot_gene_name",
               "annot_strand", "annot_chromosome", "annot_cds_length",
               "annot_gene_product")))$genes

wanted_orthos_idx <- orthos[["ORTHOLOGS_SPECIES"]] == "Leishmania major strain Friedlin"
sum(wanted_orthos_idx)
wanted_orthos <- orthos[wanted_orthos_idx, ]
wanted_orthos <- wanted_orthos[, c("GID", "ORTHOLOGS_ID", "ORTHOLOGS_NAME")]

collapsed_orthos <- wanted_orthos %>%
  group_by(GID) %>%
  summarise(collapsed_id = stringr::str_c(ORTHOLOGS_ID, collapse = " ; "),
            collapsed_name = stringr::str_c(ORTHOLOGS_NAME, collapse = " ; "))
all_lp_annot <- merge(all_lp_annot, collapsed_orthos, by.x = "row.names",
                      by.y = "GID", all.x = TRUE)
rownames(all_lp_annot) <- all_lp_annot[["Row.names"]]
all_lp_annot[["Row.names"]] <- NULL
data_structures <- c(data_structures, "lp_lengths", "lp_go", "all_lp_annot")

6 Load a genome

The following block loads the full genome sequence for panamensis. We may use this later to attempt to estimate PCR primers to discern strains.

I am not sure how to increase the number of open files in a container, as a result this does not work.

## testing_panamensis <- make_eupath_bsgenome(entry = panamensis_entry, eu_version = "v46")
pkg_candidates <- grepl(x = all_installed, pattern = "BSGenome\\.Leishmania\\.panamensis.*")
pkg_name <- all_installed[pkg_candidates][1]
library(as.character(pkg_name), character.only = TRUE)

## Loading required package: GenomeInfoDb

## Loading required package: BSgenome

## Loading required package: GenomicRanges

## Loading required package: Biostrings

## Loading required package: XVector

## 
## Attaching package: 'Biostrings'

## The following object is masked from 'package:base':
## 
##     strsplit

## Loading required package: BiocIO

## Loading required package: rtracklayer

lp_genome <- get0(as.character(pkg_name))
data_structures <- c(data_structures, "lp_genome")

7 Generate Expressionsets and Sample Estimation

The process of sample estimation takes two primary inputs:

The sample sheet, which contains all the metadata we currently have on hand, including filenames for the outputs of #3 and #4 above.
The gene annotations.

An expressionSet(or summarizedExperiment) is a data structure used in R to examine RNASeq data. It is comprised of annotations, metadata, and expression data. In the case of our processing pipeline, the location of the expression data is provided by the filenames in the metadata.

7.1 Notes

The following samples are much lower coverage:

TMRC20002
TMRC20006
TMRC20007
TMRC20008

There is a set of strains which acquired resistance in vitro. These are included in the dataset, but there are not likely enough of them to query that question explicitly.

7.2 Define colors

The following list contains the colors we have chosen to use when plotting the various ways of discerning the data.

color_choices <- list(
    "strain" = list(
        ## "z1.0" = "#333333", ## Changed this to 'braz' to make it easier to find them.
        "z2.0" = "#555555",
        "z3.0" = "#777777",
        "z2.1" = "#874400",
        "z2.2" = "#0000cc",
        "z2.3" = "#cc0000",
        "z2.4" = "#df7000",
        "z3.2" = "#888888",
        "z1.0" = "#cc00cc",
        "z1.5" = "#cc00cc",
        "b2904" = "#cc00cc",
        "unknown" = "#cbcbcb"),
    ## "null" = "#000000"),
    "zymo" = list(
      "z22" = "#0000cc",
      "z23" = "#cc0000"),
    "cf" = list(
        "cure" = "#006f00",
        "fail" = "#9dffa0",
        "unknown" = "#cbcbcb",
        "notapplicable" = "#000000"),
    "susceptibility" = list(
        "resistant" = "#8563a7",
        "sensitive" = "#8d0000",
        "ambiguous" = "#cbcbcb",
        "unknown" = "#555555"))
data_structures <- c(data_structures, "color_choices")

8 Parasite-only data structure

The data structure ‘lp_se’ contains the data for all samples which have hisat2 count tables, and which pass a few initial quality tests (e.g. they must have more than 8550 genes with >0 counts and >5e6 reads which mapped to a gene); genes which are annotated with a few key redundant categories (leishmanolysin for example) are also culled.

8.1 All (almost) samples

There are a few metadata columns which we really want to make certain are standardized.

Note: I changed this to print both the number of reads and genes for removed samples.

202510: Commenting out the semantic filter and will either not apply it or move it to somewhere after the visualization of the data.

sanitize_columns <- c("passagenumber", "clinicalresponse", "clinicalcategorical",
                      "zymodemecategorical", "included")
lp_se <- create_se(sample_sheet,
                   gene_info = all_lp_annot,
                   annotation_name = orgdb_pkg_name,
                   savefile = glue("rda/tmrc2_lp_se_all_raw-v{ver}.rda"),
                   id_column = "hpglidentifier",
                   file_column = "lpanamensisv36hisatfile") %>%
  set_conditions(fact = "zymodemecategorical", colors = color_choices[["strain"]]) %>%
##  semantic_filter(semantic = c("amastin", "gp63", "leishmanolysin"),
##                       semantic_column = "annot_gene_product") %>%
  sanitize_metadata(columns = sanitize_columns) %>%
  subset_se(subset = "included=='yes'") %>%
  set_factors(columns = sanitize_columns, class = "factor")

## Reading the sample metadata.

## Did not find the column: hpglidentifier.

## Setting the ID column to the first column.

## Checking the state of the condition column.

## Checking the state of the batch column.

## Checking the condition factor.

## The sample definitions comprises: 93 rows(samples) and 74 columns(metadata fields).

## Matched 8778 annotations and counts.

## The final summarized experiment has 8778 rows and 74 columns.

## The numbers of samples by condition are:

## 
## z2.1 z2.2 z2.3 z2.4 
##    7   43   41    2

## Warning in set_se_colors(new_se, colors = colors): Colors for the following
## categories are not being used: z2.0, z3.0, z3.2, z1.0, z1.5, b2904, unknown.

## Recasting the data.frame to DataFrame.

##    rownames           sampleid         tubelabelorigin    included
##  Length:93          Length:93          Length:93          yes:93  
##  Class :character   Class :character   Class :character           
##  Mode  :character   Mode  :character   Mode  :character           
##                                                                   
##                                                                   
##                                                                   
##                                                                   
##   sourcelab          expperson           pathogen         pathogenstrain    
##  Length:93          Length:93          Length:93          Length:93         
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##      host           parasitestage         phase           passagenumber
##  Length:93          Length:93          Length:93          2:89         
##  Class :character   Class :character   Class :character   3: 3         
##  Mode  :character   Mode  :character   Mode  :character   4: 1         
##                                                                        
##                                                                        
##                                                                        
##                                                                        
##  parasitenumber     clinicalresponse clinicalcategorical zymodemeanalysis  
##  Length:93          cure   :41       cure   :41          Length:93         
##  Class :character   failure:34       fail   :34          Class :character  
##  Mode  :character   nd     :18       unknown:18          Mode  :character  
##                                                                            
##                                                                            
##                                                                            
##                                                                            
##  zymodemecategorical phenotypiccharacteristics
##  z21: 7              Min.   :2.10             
##  z22:43              1st Qu.:2.20             
##  z23:41              Median :2.20             
##  z24: 2              Mean   :2.24             
##                      3rd Qu.:2.30             
##                      Max.   :2.40             
##                                               
##  susceptibilityinfectionreduction32ugmlsbvhistoricaldata
##  Length:93                                              
##  Class :character                                       
##  Mode  :character                                       
##                                                         
##                                                         
##                                                         
##                                                         
##  susceptibilityinfectionreduction32ugmlsbvcurrentdata
##  Length:93                                           
##  Class :character                                    
##  Mode  :character                                    
##                                                      
##                                                      
##                                                      
##                                                      
##  qualitativeclassificationofdrugsusceptibility rnapreservation   
##  Length:93                                     Length:93         
##  Class :character                              Class :character  
##  Mode  :character                              Mode  :character  
##                                                                  
##                                                                  
##                                                                  
##                                                                  
##  rnaextractiondate  rnaqctesteddate      rnangul          rnaqcpassed       
##  Min.   :20181024   Min.   :20181024   Length:93          Length:93         
##  1st Qu.:20200918   1st Qu.:20200921   Class :character   Class :character  
##  Median :20210211   Median :20210217   Mode  :character   Mode  :character  
##  Mean   :20202867   Mean   :20204528                                        
##  3rd Qu.:20210913   3rd Qu.:20210914                                        
##  Max.   :20211112   Max.   :20211116                                        
##                     NA's   :1                                               
##    rnangul1           x260280            x260230           rnavolumeul  
##  Length:93          Length:93          Length:93          Min.   :24.1  
##  Class :character   Class :character   Class :character   1st Qu.:30.0  
##  Mode  :character   Mode  :character   Mode  :character   Median :30.0  
##                                                           Mean   :29.8  
##                                                           3rd Qu.:30.0  
##                                                           Max.   :30.0  
##                                                           NA's   :8     
##  rnaavailableul libraryconstdate   libraryqcdate     
##  Min.   :17.1   Min.   :20181025   Min.   :20181029  
##  1st Qu.:26.2   1st Qu.:20200922   1st Qu.:20200564  
##  Median :27.4   Median :20210303   Median :20201223  
##  Mean   :26.6   Mean   :20204976   Mean   :20203133  
##  3rd Qu.:27.7   3rd Qu.:20210923   3rd Qu.:20210317  
##  Max.   :28.5   Max.   :20211223   Max.   :20211223  
##  NA's   :8                         NA's   :22        
##  rnausedtoconstructlibrariesul rnausedtoconstructlibrariesug libqcpassed       
##  Min.   :0.410                 Length:93                     Length:93         
##  1st Qu.:0.797                 Class :character              Class :character  
##  Median :1.060                 Mode  :character              Mode  :character  
##  Mean   :1.614                                                                 
##  3rd Qu.:2.318                                                                 
##  Max.   :8.010                                                                 
##  NA's   :9                                                                     
##      index      indexsequence      libraryvolumeul
##  Min.   : 1.0   Length:93          Min.   :27.0   
##  1st Qu.: 7.0   Class :character   1st Qu.:28.0   
##  Median :12.0   Mode  :character   Median :28.0   
##  Mean   :13.3                      Mean   :27.9   
##  3rd Qu.:20.0                      3rd Qu.:28.0   
##  Max.   :27.0                      Max.   :28.0   
##                                                   
##  libraryvolumesenttonajibu00b4slabul shipmentu00a0date  descriptonandremarks
##  Min.   :15.0                        Min.   :20200217   Length:93           
##  1st Qu.:15.0                        1st Qu.:20210104   Class :character    
##  Median :15.0                        Median :20210427   Mode  :character    
##  Mean   :15.1                        Mean   :20209109                       
##  3rd Qu.:15.0                        3rd Qu.:20211012                       
##  Max.   :28.0                        Max.   :20220103                       
##                                      NA's   :8                              
##  librarybioanalyzerprofileelsayedlabfilenamewelllane libraryconcnm 
##  Length:93                                           Min.   : 1.7  
##  Class :character                                    1st Qu.:25.4  
##  Mode  :character                                    Median :36.6  
##                                                      Mean   :38.8  
##                                                      3rd Qu.:54.1  
##                                                      Max.   :82.9  
##                                                      NA's   :50    
##  samplefor100ul2or4nmsequencing waterfor100ul2nmsequencing sequencingorderno 
##  Min.   : 2.51                  Min.   :-1.76              Length:93         
##  1st Qu.: 3.56                  1st Qu.:89.33              Class :character  
##  Median : 7.34                  Median :92.55              Mode  :character  
##  Mean   : 8.93                  Mean   :84.40                                
##  3rd Qu.:10.38                  3rd Qu.:95.77                                
##  Max.   :41.67                  Max.   :97.49                                
##  NA's   :66                     NA's   :66                                   
##   seqorderdate      seqcompletedate      totalreads        trimmedreads     
##  Min.   :20191107   Length:93          Min.   :1.76e+06   Min.   :1.44e+06  
##  1st Qu.:20191107   Class :character   1st Qu.:2.63e+07   1st Qu.:2.13e+07  
##  Median :20210427   Mode  :character   Median :3.13e+07   Median :2.64e+07  
##  Mean   :20201840                      Mean   :4.25e+07   Mean   :3.59e+07  
##  3rd Qu.:20210427                      3rd Qu.:4.59e+07   3rd Qu.:3.59e+07  
##  Max.   :20210427                      Max.   :1.60e+08   Max.   :1.47e+08  
##  NA's   :84                            NA's   :22         NA's   :22        
##   percentkept    lpanamensisv36salmonfile lpanamensisv36hisatfile
##  Min.   :0.588   Length:93                Length:93              
##  1st Qu.:0.796   Class :character         Class :character       
##  Median :0.854   Mode  :character         Mode  :character       
##  Mean   :0.834                                                   
##  3rd Qu.:0.902                                                   
##  Max.   :0.932                                                   
##  NA's   :25                                                      
##  hisatsinglemappedconcordant hisatmultimappedconcordant
##  Min.   :1.85e+05            Min.   :  19166           
##  1st Qu.:1.82e+07            1st Qu.:1080740           
##  Median :2.22e+07            Median :1354729           
##  Mean   :3.02e+07            Mean   :1936290           
##  3rd Qu.:3.05e+07            3rd Qu.:2092224           
##  Max.   :1.21e+08            Max.   :7648225           
##  NA's   :22                  NA's   :22                
##  hisatconcordantmappingrate hisatdiscordantsingle hisatdiscordantmulti
##  Min.   :0.00659            Min.   :  319672      Min.   :  47820     
##  1st Qu.:0.88420            1st Qu.:  558865      1st Qu.:  67872     
##  Median :0.90733            Median :  788489      Median :  76361     
##  Mean   :0.89400            Mean   : 4281951      Mean   : 963850     
##  3rd Qu.:0.92829            3rd Qu.:  850646      3rd Qu.: 102498     
##  Max.   :0.97614            Max.   :22441366      Max.   :5406308     
##  NA's   :22                 NA's   :87            NA's   :87          
##  hisattotalrate   bcftable         freebayessummary    r1slforward   
##  Min.   :0.9    Length:93          Length:93          Min.   :  0.0  
##  1st Qu.:0.9    Class :character   Class :character   1st Qu.: 13.0  
##  Median :0.9    Mode  :character   Mode  :character   Median : 24.0  
##  Mean   :0.9                                          Mean   : 29.2  
##  3rd Qu.:0.9                                          3rd Qu.: 37.0  
##  Max.   :0.9                                          Max.   :111.0  
##  NA's   :92                                           NA's   :32     
##   r1slrevcomp     r2slforward       r2slrevcomp      zymodemereference 
##  Min.   :   38   Min.   : 101616   Min.   :    0.0   Length:93         
##  1st Qu.:  226   1st Qu.: 237498   1st Qu.:    2.0   Class :character  
##  Median :  479   Median : 328730   Median :    4.5   Mode  :character  
##  Mean   : 4168   Mean   : 453401   Mean   :  907.5                     
##  3rd Qu.: 1360   3rd Qu.: 552578   3rd Qu.:    9.0                     
##  Max.   :51878   Max.   :1450388   Max.   :47191.0                     
##  NA's   :32      NA's   :39        NA's   :39                          
##  knnv2classification  knnv2notes        hclustclade        hclustnotes       
##  Length:93           Length:93          Length:93          Length:93         
##  Class :character    Class :character   Class :character   Class :character  
##  Mode  :character    Mode  :character   Mode  :character   Mode  :character  
##                                                                              
##                                                                              
##                                                                              
##                                                                              
##  knnhclusttogethercall  condition               batch   
##  Length:93             Length:93          undefined:93  
##  Class :character      Class :character                 
##  Mode  :character      Mode  :character                 
##                                                         
##                                                         
##                                                         
##

data_structures <- c(data_structures, "lp_se")
save(list = "lp_se", file = glue("rda/tmrc2_lp_se_all_sanitized-v{ver}.rda"))

table(colData(lp_se)[["zymodemecategorical"]])

## 
## z21 z22 z23 z24 
##   7  43  41   2

table(colData(lp_se)[["clinicalresponse"]])

## 
##    cure failure      nd 
##      41      34      18

table(colData(lp_se)[["clinicalcategorical"]])

## 
##    cure    fail unknown 
##      41      34      18

ncol(assay(lp_se))

## [1] 93

8.2 Print sample IDs by status

8.2.1 Cure

cure_ids <- colData(lp_se)[["clinicalcategorical"]] == "cure"
rownames(colData(lp_se))[cure_ids]

##  [1] "TMRC20002" "TMRC20004" "TMRC20067" "TMRC20068" "TMRC20041" "TMRC20015"
##  [7] "TMRC20009" "TMRC20016" "TMRC20011" "TMRC20017" "TMRC20019" "TMRC20024"
## [13] "TMRC20036" "TMRC20069" "TMRC20033" "TMRC20031" "TMRC20055" "TMRC20078"
## [19] "TMRC20094" "TMRC20042" "TMRC20058" "TMRC20072" "TMRC20059" "TMRC20048"
## [25] "TMRC20057" "TMRC20088" "TMRC20056" "TMRC20043" "TMRC20046" "TMRC20093"
## [31] "TMRC20089" "TMRC20047" "TMRC20090" "TMRC20044" "TMRC20045" "TMRC20108"
## [37] "TMRC20096" "TMRC20101" "TMRC20092" "TMRC20091" "TMRC20095"

8.2.2 Fail

fail_ids <- colData(lp_se)[["clinicalcategorical"]] == "fail"
rownames(colData(lp_se))[fail_ids]

##  [1] "TMRC20001" "TMRC20065" "TMRC20039" "TMRC20010" "TMRC20012" "TMRC20013"
##  [7] "TMRC20014" "TMRC20018" "TMRC20070" "TMRC20020" "TMRC20021" "TMRC20022"
## [13] "TMRC20026" "TMRC20076" "TMRC20073" "TMRC20079" "TMRC20071" "TMRC20060"
## [19] "TMRC20083" "TMRC20085" "TMRC20105" "TMRC20109" "TMRC20098" "TMRC20082"
## [25] "TMRC20102" "TMRC20099" "TMRC20100" "TMRC20084" "TMRC20087" "TMRC20103"
## [31] "TMRC20104" "TMRC20086" "TMRC20107" "TMRC20081"

8.2.3 Unknown

unknown_ids <- colData(lp_se)[["clinicalcategorical"]] == "unknown"
rownames(colData(lp_se))[unknown_ids]

##  [1] "TMRC20005" "TMRC20066" "TMRC20037" "TMRC20038" "TMRC20077" "TMRC20074"
##  [7] "TMRC20063" "TMRC20053" "TMRC20052" "TMRC20064" "TMRC20075" "TMRC20051"
## [13] "TMRC20050" "TMRC20049" "TMRC20062" "TMRC20110" "TMRC20080" "TMRC20054"

8.2.4 Susceptible and strain

all_sensitive_ids <- colData(lp_se)[["qualitativeclassificationofdrugsusceptibility"]] == "Sensitive"
sensitive_ids <- rownames(colData(lp_se))[all_sensitive_ids]
sensitive_ids

##  [1] "TMRC20002" "TMRC20004" "TMRC20005" "TMRC20039" "TMRC20041" "TMRC20009"
##  [7] "TMRC20011" "TMRC20012" "TMRC20017" "TMRC20014" "TMRC20019" "TMRC20020"
## [13] "TMRC20022" "TMRC20024" "TMRC20036" "TMRC20069" "TMRC20033" "TMRC20026"
## [19] "TMRC20031" "TMRC20076" "TMRC20055" "TMRC20078" "TMRC20072" "TMRC20057"
## [25] "TMRC20056" "TMRC20060" "TMRC20077" "TMRC20074" "TMRC20063" "TMRC20053"
## [31] "TMRC20050" "TMRC20049" "TMRC20110" "TMRC20083" "TMRC20046" "TMRC20093"
## [37] "TMRC20044" "TMRC20045" "TMRC20109" "TMRC20096" "TMRC20092" "TMRC20091"
## [43] "TMRC20084" "TMRC20087" "TMRC20103" "TMRC20086" "TMRC20081"

all_resistant_ids <- colData(lp_se)[["qualitativeclassificationofdrugsusceptibility"]] == "Resistant"
resistant_ids <- rownames(colData(lp_se))[all_resistant_ids]
resistant_ids

##  [1] "TMRC20001" "TMRC20065" "TMRC20066" "TMRC20037" "TMRC20038" "TMRC20067"
##  [7] "TMRC20068" "TMRC20015" "TMRC20010" "TMRC20016" "TMRC20013" "TMRC20018"
## [13] "TMRC20070" "TMRC20021" "TMRC20073" "TMRC20079" "TMRC20071" "TMRC20094"
## [19] "TMRC20042" "TMRC20058" "TMRC20059" "TMRC20048" "TMRC20088" "TMRC20052"
## [25] "TMRC20064" "TMRC20075" "TMRC20051" "TMRC20062" "TMRC20080" "TMRC20043"
## [31] "TMRC20054" "TMRC20085" "TMRC20089" "TMRC20047" "TMRC20090" "TMRC20105"
## [37] "TMRC20108" "TMRC20098" "TMRC20101" "TMRC20082" "TMRC20102" "TMRC20099"
## [43] "TMRC20100" "TMRC20104" "TMRC20107" "TMRC20095"

all_z23 <- colData(lp_se)[["zymodemecategorical"]] == "z23"
z23_ids <- rownames(colData(lp_se))[all_z23]
z23_ids

##  [1] "TMRC20001" "TMRC20065" "TMRC20066" "TMRC20037" "TMRC20038" "TMRC20067"
##  [7] "TMRC20068" "TMRC20015" "TMRC20010" "TMRC20016" "TMRC20013" "TMRC20018"
## [13] "TMRC20070" "TMRC20021" "TMRC20073" "TMRC20079" "TMRC20071" "TMRC20094"
## [19] "TMRC20058" "TMRC20059" "TMRC20048" "TMRC20052" "TMRC20064" "TMRC20075"
## [25] "TMRC20051" "TMRC20062" "TMRC20080" "TMRC20043" "TMRC20054" "TMRC20085"
## [31] "TMRC20089" "TMRC20090" "TMRC20105" "TMRC20098" "TMRC20082" "TMRC20102"
## [37] "TMRC20099" "TMRC20100" "TMRC20104" "TMRC20107" "TMRC20095"

all_z22 <- colData(lp_se)[["zymodemecategorical"]] == "z22"
z22_ids <- rownames(colData(lp_se))[all_z22]
z22_ids

##  [1] "TMRC20002" "TMRC20004" "TMRC20005" "TMRC20039" "TMRC20041" "TMRC20009"
##  [7] "TMRC20011" "TMRC20012" "TMRC20017" "TMRC20014" "TMRC20019" "TMRC20020"
## [13] "TMRC20022" "TMRC20024" "TMRC20036" "TMRC20069" "TMRC20033" "TMRC20026"
## [19] "TMRC20031" "TMRC20076" "TMRC20055" "TMRC20078" "TMRC20042" "TMRC20072"
## [25] "TMRC20088" "TMRC20060" "TMRC20077" "TMRC20074" "TMRC20063" "TMRC20053"
## [31] "TMRC20050" "TMRC20049" "TMRC20110" "TMRC20083" "TMRC20046" "TMRC20044"
## [37] "TMRC20109" "TMRC20096" "TMRC20101" "TMRC20092" "TMRC20087" "TMRC20086"
## [43] "TMRC20081"

both_ids <- z22_ids %in% resistant_ids
summary(both_ids)

##    Mode   FALSE    TRUE 
## logical      40       3

rownames(colData(lp_se))[both_ids]

## [1] "TMRC20019" "TMRC20020" "TMRC20078" "TMRC20085" "TMRC20093" "TMRC20102"

both_ids <- z23_ids %in% sensitive_ids
summary(both_ids)

##    Mode   FALSE 
## logical      41

All the following data will derive from this starting point.

8.3 Extract samples from only the two ‘canonical’ strains

8.3.1 Quick divergence

Here is a table of my current classifier’s interpretation of the strains.

table(colData(lp_se)[["knnv2classification"]])

## 
## unknown     z21     z22     z23     z24 
##       2       5      43      41       2

8.3.2 Merge 2.1/2.2 and 2.4/2.3

merged_zymo <- lp_se
colData(merged_zymo)[["zymodeme"]] <- as.character(colData(merged_zymo)[["zymodemecategorical"]])
z21_idx <- colData(merged_zymo)[["zymodeme"]] == "z21"
colData(merged_zymo)[z21_idx, "zymodeme"] <- "z22"

z24_idx <- colData(merged_zymo)[["zymodeme"]] == "z24"
colData(merged_zymo)[z24_idx, "zymodeme"] <- "z23"

keepers <- colData(merged_zymo)[["zymodeme"]] == "z22" |
  colData(merged_zymo)[["zymodeme"]] == "z23"
merged_zymo <- merged_zymo[, keepers] %>%
  set_conditions(fact = "zymodeme", colors = color_choices[["zymo"]])

## The numbers of samples by condition are:

## 
## z22 z23 
##  50  43

9 Add library sizes before filtering

table(colData(lp_se)[["clinicalcategorical"]])

## 
##    cure    fail unknown 
##      41      34      18

unknown_ids <- colData(lp_se)[["clinicalcategorical"]] == "unknown"
rownames(colData(lp_se))[unknown_ids]

##  [1] "TMRC20005" "TMRC20066" "TMRC20037" "TMRC20038" "TMRC20077" "TMRC20074"
##  [7] "TMRC20063" "TMRC20053" "TMRC20052" "TMRC20064" "TMRC20075" "TMRC20051"
## [13] "TMRC20050" "TMRC20049" "TMRC20062" "TMRC20110" "TMRC20080" "TMRC20054"

failed_ids <- colData(lp_se)[["clinicalcategorical"]] == "fail"
rownames(colData(lp_se))[failed_ids]

##  [1] "TMRC20001" "TMRC20065" "TMRC20039" "TMRC20010" "TMRC20012" "TMRC20013"
##  [7] "TMRC20014" "TMRC20018" "TMRC20070" "TMRC20020" "TMRC20021" "TMRC20022"
## [13] "TMRC20026" "TMRC20076" "TMRC20073" "TMRC20079" "TMRC20071" "TMRC20060"
## [19] "TMRC20083" "TMRC20085" "TMRC20105" "TMRC20109" "TMRC20098" "TMRC20082"
## [25] "TMRC20102" "TMRC20099" "TMRC20100" "TMRC20084" "TMRC20087" "TMRC20103"
## [31] "TMRC20104" "TMRC20086" "TMRC20107" "TMRC20081"

pre_libsize <- plot_libsize(lp_se)

## Warning in fortify(data, ...): Arguments in `...` must be used.
## x Problematic argument:
## * colour = colors
## i Did you misspell an argument name?

pre_libsize

## Library sizes of 93 samples, 
## ranging from 564,812 to 1.37e+08.

pdf(file = "figures/library_size_pre_filter.pdf", width = 24, height = 12)
pre_libsize$plot
dev.off()

## png 
##   2

pre_nonzero <- plot_nonzero(lp_se, y_intercept = 0.99)

## Scale for colour is already present.
## Adding another scale for colour, which will replace the existing scale.

## Scale for fill is already present.
## Adding another scale for fill, which will replace the existing scale.

## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## i Please use `linewidth` instead.
## i The deprecated feature was likely used in the hpgltools package.
##   Please report the issue to the authors.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

pre_nonzero

## A non-zero genes plot of 93 samples.
## These samples have an average 28.6 CPM coverage and 8691 genes observed, ranging from 8452 to
## 8749.

## Warning: ggrepel: 77 unlabeled data points (too many overlaps). Consider
## increasing max.overlaps

pdf(file = "figures/nonzero_pre_filter.pdf")
pre_nonzero$plot

## Warning: ggrepel: 82 unlabeled data points (too many overlaps). Consider
## increasing max.overlaps

dev.off()

## png 
##   2

lp_se_pre <- lp_se
lp_se <- subset_se(lp_se, nonzero = 8550)

## The samples (and read coverage) removed when filtering 8550 non-zero genes are:

## TMRC20002 
##  11681227 
## TMRC20002 
##      8452

## Samples removed: 8452

post_nonzero <- plot_nonzero(lp_se, y_intercept = 0.99)

## Scale for colour is already present.
## Adding another scale for colour, which will replace the existing scale.
## Scale for fill is already present.
## Adding another scale for fill, which will replace the existing scale.

post_nonzero

## A non-zero genes plot of 92 samples.
## These samples have an average 28.78 CPM coverage and 8694 genes observed, ranging from 8554 to
## 8749.

## Warning: ggrepel: 76 unlabeled data points (too many overlaps). Consider
## increasing max.overlaps

## Quick test to see that I have my S4 dispatch working properly
test <- normalize(lp_se)

9.1 Extract historical susceptibility data

Column ‘Q’ in the sample sheet, make a categorical version of it with these parameters:

0 <= x <= 35 is resistant
36 <= x <= 48 is ambiguous
49 <= x is sensitive

Note that these cutoffs are only valid for the historical data. The newer susceptibility data uses a cutoff of 0.78 for sensitive. I will set ambiguous to 0.5 to 0.78?

max_resist_historical <- 0.35
min_sensitive_historical <- 0.49
## 202305: Removed ambiguous category for the current set.
max_resist_current <- 0.77
min_sensitive_current <- 0.77

The sanitize_percent() function seeks to make the percentage values recorded by excel more reliable. Unfortunately, sometimes excel displays the value ‘49%’ when the information recorded in the worksheet is any one of the following:

’49%
0.49
“0.49”

Thus, the following block will sanitize these percentage values into a single decimal number and make a categorical variable from it using pre-defined values for resistant/ambiguous/sensitive. This categorical variable will be stored in a new column: ‘sus_category_historical’.

st <- colData(lp_se)[["susceptibilityinfectionreduction32ugmlsbvhistoricaldata"]]
starting <- sanitize_percent(st)
st

##  [1] "0.45"    "0.14"    "0.99"    "0.97"    "0"       "0.97"    "0"      
##  [8] "0"       "0.46"    "0.45"    "0.97"    "0.56"    "0.99"    "0.46"   
## [15] "0.7"     "0.99"    "0.99"    "0.45"    "0.98"    "0.99"    "0.49"   
## [22] "No data" "No data" "0.99"    "0.66"    "0.99"    "0.99"    "1"      
## [29] "1"       "0.94"    "0.94"    "No data" "No data" "No data" "No data"
## [36] "No data" "No data" "No data" "No data" "No data" "No data" "No data"
## [43] "No data" "No data" "No data" "0.99"    "0.99"    "No data" "0.98"   
## [50] "0.97"    "0.96"    "0.96"    "0"       "0"       "0"       "0.06"   
## [57] "0.94"    "0.94"    "0.03"    "0.94"    "0"       "0.25"    "0.95"   
## [64] "0.27"    "No data" "No data" "No data" "No data" "No data" "No data"
## [71] "No data" "No data" "No data" "No data" "No data" "No data" "No data"
## [78] "No data" "No data" "No data" "No data" "No data" "No data" "No data"
## [85] "No data" "No data" "No data" "No data" "No data" "No data" "No data"
## [92] "No data"

starting

##  [1] 0.45 0.14 0.99 0.97 0.00 0.97 0.00 0.00 0.46 0.45 0.97 0.56 0.99 0.46 0.70
## [16] 0.99 0.99 0.45 0.98 0.99 0.49   NA   NA 0.99 0.66 0.99 0.99 1.00 1.00 0.94
## [31] 0.94   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA
## [46] 0.99 0.99   NA 0.98 0.97 0.96 0.96 0.00 0.00 0.00 0.06 0.94 0.94 0.03 0.94
## [61] 0.00 0.25 0.95 0.27   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA
## [76]   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA
## [91]   NA   NA

sus_categorical <- starting
na_idx <- is.na(starting)
sum(na_idx)

## [1] 45

sus_categorical[na_idx] <- "unknown"

resist_idx <- starting <= max_resist_historical
sus_categorical[resist_idx] <- "resistant"
indeterminant_idx <- starting > max_resist_historical &
  starting < min_sensitive_historical
sus_categorical[indeterminant_idx] <- "ambiguous"
susceptible_idx <- starting >= min_sensitive_historical
sus_categorical[susceptible_idx] <- "sensitive"

sus_categorical <- as.factor(sus_categorical)
colData(lp_se)[["sus_category_historical"]] <- sus_categorical
table(sus_categorical)

## sus_categorical
## ambiguous resistant sensitive   unknown 
##         5        12        30        45

two_sankey <- plot_meta_sankey(
  merged_zymo, factors = c("zymodeme", "clinicalcategorical", "susceptibility"),
  drill_down = TRUE, color_choices = color_choices)

## These columns are not in the metadata: susceptibility

## Warning: attributes are not identical across measure variables; they will be
## dropped

## Warning: The `size` argument of `element_rect()` is deprecated as of ggplot2 3.4.0.
## i Please use the `linewidth` argument instead.
## i The deprecated feature was likely used in the ggsankey package.
##   Please report the issue at <https://github.com/davidsjoberg/ggsankey/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

two_sankey

## A sankey plot describing the metadata of 93 samples,
## including 8 out of 0 nodes and traversing metadata factors:
## zymodeme, clinicalcategorical.

9.2 Extract current susceptibility data

The same process will be repeated for the current iteration of the sensitivity assay and stored in the ‘sus_category_current’ column.

starting_current <- sanitize_percent(colData(lp_se)[["susceptibilityinfectionreduction32ugmlsbvcurrentdata"]])
sus_categorical_current <- starting_current
na_idx <- is.na(starting_current)
sum(na_idx)

## [1] 0

sus_categorical_current[na_idx] <- "unknown"

## The following is only valid when we had three categories, resistant/ambiguous/sensitive
## The new cutoffs drop ambiguous.
#resist_idx <- starting_current <= max_resist_current
#sus_categorical_current[resist_idx] <- "resistant"
#indeterminant_idx <- starting_current > max_resist_current &
#  starting_current < min_sensitive_current
#sus_categorical_current[indeterminant_idx] <- "ambiguous"
#susceptible_idx <- starting_current >= min_sensitive_current
#sus_categorical_current[susceptible_idx] <- "sensitive"
#sus_categorical_current <- as.factor(sus_categorical_current)
resist_idx <- starting_current <= max_resist_current
sensitive_idx <- !resist_idx
sus_categorical_current[resist_idx] <- "resistant"
sus_categorical_current[sensitive_idx] <- "sensitive"
sus_categorical_current <- as.factor(sus_categorical_current)

colData(lp_se)[["sus_category_current"]] <- sus_categorical_current
colData(lp_se)[["susceptibility"]] <- sus_categorical_current
table(sus_categorical_current)

## sus_categorical_current
## resistant sensitive 
##        46        46

lp_sankey <- plot_meta_sankey(
  lp_se, factors = c("zymodemecategorical", "clinicalcategorical", "susceptibility"),
  drill_down = TRUE, color_choices = color_choices)

## Warning: attributes are not identical across measure variables; they will be
## dropped

lp_sankey

## A sankey plot describing the metadata of 92 samples,
## including 23 out of 0 nodes and traversing metadata factors:
## zymodemecategorical, clinicalcategorical, susceptibility.

In many queries, we will seek to compare only the two primary strains, zymodeme 2.2 and 2.3. The following block will extract only those samples.

Note: IMPORTANT Maria Adelaida prefers not to use lp_two_strains. We should not at this time use the merged 2.1/2.2 and 2.4/2.3 categories.

lp_strain <- lp_se %>%
  set_batches(fact = sus_categorical_current) %>%
  set_colors(color_choices[["strain"]])

## The number of samples by batch are:

## 
## resistant sensitive 
##        46        46

## Warning in set_se_colors(exp, ...): Colors for the following categories are not
## being used: z2.0, z3.0, z3.2, z1.0, z1.5, b2904, unknown.

table(colData(lp_strain)[["condition"]])

## 
## z2.1 z2.2 z2.3 z2.4 
##    7   42   41    2

save(list = "lp_strain", file = glue("rda/tmrc2_lp_strain-v{ver}.rda"))
data_structures <- c(data_structures, "lp_strain")

lp_two_strains <- merged_zymo
save(list = "lp_two_strains",
     file = glue("rda/tmrc2_lp_two_strains-v{ver}.rda"))
data_structures <- c(data_structures, "lp_two_strains")

9.3 Clinical outcome

Clinical outcome is by far the most problematic comparison in this data, but here is the recategorization of the data using it:

lp_cf <- set_conditions(lp_se, fact = "clinicalcategorical",
                             colors = color_choices[["cf"]]) %>%
  set_batches(fact = sus_categorical_current)

## The numbers of samples by condition are:

## 
##    cure    fail unknown 
##      40      34      18

## Warning in set_se_colors(new_se, colors = colors): Colors for the following
## categories are not being used: notapplicable.

## The number of samples by batch are:

## 
## resistant sensitive 
##        46        46

table(colData(lp_cf)[["condition"]])

## 
##    cure    fail unknown 
##      40      34      18

data_structures <- c(data_structures, "lp_cf")
save(list = "lp_cf", file = glue("rda/tmrc2_lp_cf-v{ver}.rda"))

lp_cf_known <- subset_se(lp_cf, subset = "condition!='unknown'")
data_structures <- c(data_structures, "lp_cf_known")
save(list = "lp_cf_known", file = glue("rda/tmrc2_lp_cf_known-v{ver}.rda"))
data_structures <- c(data_structures, "lp_cf_known")
save(list = "lp_cf_known", file = glue("rda/tmrc2_lp_cf_known-v{ver}.rda"))

9.4 Create a historical susceptibility dataset

Use the factorized version of susceptibility to categorize the samples by the historical data.

lp_susceptibility_historical <- set_conditions(
  lp_se, fact = "sus_category_historical", colors = color_choices[["susceptibility"]]) %>%
  set_batches(fact = "clinicalcategorical")

## The numbers of samples by condition are:

## 
## ambiguous resistant sensitive   unknown 
##         5        12        30        45

## The number of samples by batch are:

## 
##    cure    fail unknown 
##      40      34      18

save(list = "lp_susceptibility_historical",
     file = glue("rda/tmrc2_lp_susceptibility_historical-v{ver}.rda"))
data_structures <- c(data_structures, "lp_susceptibility_historical")

9.5 Create a current susceptibility dataset

Use the factorized version of susceptibility to categorize the samples by the historical data.

This will likely be our canonical susceptibility dataset, so I will remove the suffix and just call it ‘lp_susceptibility’.

lp_susceptibility <- set_conditions(
  lp_se, fact = "sus_category_current", colors = color_choices[["susceptibility"]]) %>%
  set_batches(fact = "clinicalcategorical")

## The numbers of samples by condition are:

## 
## resistant sensitive 
##        46        46

## Warning in set_se_colors(new_se, colors = colors): Colors for the following
## categories are not being used: ambiguous, unknown.

## The number of samples by batch are:

## 
##    cure    fail unknown 
##      40      34      18

save(list = "lp_susceptibility",
     file = glue("rda/tmrc2_lp_susceptibility-v{ver}.rda"))
data_structures <- c(data_structures, "lp_susceptibility")

9.6 Pull out only the samples with two zymodemes

I think this is redundant with a previous block, but I am leaving it until I am certain that it is not required in a following document.

Note: IMPORTANT This is the set Maria Adeliada prefers to use.

lp_zymo <- subset_se(lp_se, subset = "condition=='z2.2'|condition=='z2.3'")
data_structures <- c(data_structures, "lp_zymo")
save(list = "lp_zymo", file = glue("rda/tmrc2_lp_zymo-v{ver}.rda"))

10 Variant data using parasite RNASeq reads

The following section will create some initial data structures of the observed variants in the parasite samples. This will include some of our 2016 samples for some classification queries.

10.1 The 2016 variant data

I changed and improved the mapping and variant detection methods from what we used for the 2016 data. So some small changes will be required to merge them.

lp_previous <- create_se("sample_sheets/tmrc2_samples_20191203.xlsx",
                           file_column = "tophat2file",
                           savefile = glue("rda/lp_previous-v{ver}.rda"))
tt <- lp_previous$expressionset
rownames(tt) <- gsub(pattern = "^exon_", replacement = "", x = rownames(tt))
rownames(tt) <- gsub(pattern = "\\.1$", replacement = "", x = rownames(tt))
rownames(tt) <- gsub(pattern = "\\-1$", replacement = "", x = rownames(tt))
lp_previous$expressionset <- tt
rm(tt)
data_structures <- c(data_structures, "lp_previous")

10.2 Create the SNP expressionset

The count_se_snps() function uses our expressionset data and a metadata column in order to extract the mpileup or freebayes-based variant calls and create matrices of the likelihood that each position-per-sample is in fact a variant.

There is an important caveat here which changed on 202301: I was interpreting using the PAIRED tag, which is only used for, unsurprisingly, paired-end samples. A couple samples are not paired and so were failing silently. The QA tag looks like it is more appropriate and should work across both types. One way to find out, I am setting it here and will look to see if the results make more sense for my test samples (TMRC2001, TMRC2005, TMRC2007).

## The next line drops the samples which are missing the SNP pipeline.
lp_snp <- subset_se(lp_se, subset = "!is.na(colData(lp_se)[['freebayessummary']])")

lp_snp_sufficient <- subset_se(lp_snp, subset = "rownames!='TMRC20082'")
lp_snp_only22_23_ref <- subset_se(lp_snp, subset = "zymodemereference=='z2.2'|zymodemereference=='z2.3'") %>%
  subset_se(subset = "rownames!='TMRC20082'")
lp_snp_22_23_ml <- subset_se(lp_snp, subset = "knnv2classification=='z22'|knnv2classification=='z23'") %>%
  subset_se(subset = "rownames!='TMRC20082'")

new_snps_sufficient <- count_snps(lp_snp_sufficient, annot_column = "freebayessummary",
                                  snp_column = "QA", reader = "readr")

## Using the snp column: QA from the sample annotations.

## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## New names:
## * `DP` -> `DP...3`
## * `RO` -> `RO...8`
## * `AO` -> `AO...9`
## * `QR` -> `QR...12`
## * `QA` -> `QA...13`
## * `DP` -> `DP...42`
## * `RO` -> `RO...43`
## * `QR` -> `QR...44`
## * `AO` -> `AO...45`
## * `QA` -> `QA...46`

new_snps_only22_23_ref_suf <- count_snps(lp_snp_only22_23_ref, annot_column = "freebayessummary",
                                         snp_column = "QA", reader = "readr")

## Using the snp column: QA from the sample annotations.
## New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:

new_snps_22_23_ml_suf <- count_snps(lp_snp_22_23_ml, annot_column = "freebayessummary",
                                    snp_column = "QA", reader = "readr")

## Using the snp column: QA from the sample annotations.
## New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:New names:

## Lets see if we get numbers which make sense.
summary(assay(new_snps_sufficient)[["TMRC20001"]])  ## My weirdo sample

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     0.0     0.0     0.0    22.8     0.0  2217.0

summary(assay(new_snps_sufficient)[["TMRC20072"]])  ## Another sample chosen at random

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##       0       0       0     104       0  247568

summary(assay(new_snps_sufficient)[["TMRC20021"]])  ## Another sample chosen at random

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##       0       0       0    1121       0 1708458

## Now that we are reasonably confident that things make more sense, lets save and move on...
data_structures <- c(data_structures, "new_snps_sufficient", "lp_snp")

## Most of the time I just run normalize() and assume it will dispatch to normalize_se()
sufficient_norm <- normalize(new_snps_sufficient, transform = "log2")

## transform_counts: Found 79143354 values equal to 0, adding 1 to the matrix.

plot_boxplot(sufficient_norm)

Now let us pull in the 2016 data.

old_snps <- count_snps(lp_previous, annot_column = "bcftable", snp_column = 2)
data_structures <- c(data_structures, "old_snps")

save(list = "lp_snp", file = glue("rda/lp_snp-v{ver}.rda"))
data_structures <- c(data_structures, "lp_snp")
save(list = "new_snps", file = glue("rda/new_snps-v{ver}.rda"))
data_structures <- c(data_structures, "new_snps")
save(list = "old_snps", file = glue("rda/old_snps-v{ver}.rda"))
data_structures <- c(data_structures, "old_snps")

nonzero_snps <- assay(new_snps) != 0
colSums(nonzero_snps)

10.3 Combine the previous and current data

As far as I can tell, freebayes and mpileup are reasonably similar in their sensitivity/specificity; so combining the two datasets like this is expected to work with minimal problems. The most likely problem is that my mpileup-based pipeline is unable to handle indels.

## My old_snps is using an older annotation incorrectly, so fix it here:
#annotation(old_snps) <- annotation(new_snps)
both_snps <- combine_ses(new_snps, old_snps)
save(list = "both_snps",
     file = glue("rda/both_snps-v{ver}.rda"))
data_structures <- c(data_structures, "both_snps")

11 Subclade manual interpretation

I am taking a heatmap from our variant data and manually identifying sample groups.

A: TMRC20025, TMRC20027, TMRC20028
B: hpgl0641, hpgl0247, hpgl0631, hpgl0658, close to A
C: TMRC20008, TMRC20007, TMRC20001, TMRC20005, hpgl0318, TMRC20012
D: hpgl0643, hpgl0316, hpgl0320, hpgl0641, close to C
E: TMRC20032, TMRC20061
F: TMRC20040, TMRC20036, hpgl0245, TMRC20103, TMRC20093, TMRC20045, TMRC20041, TMRC20072, TMRC20046, TMRC20057, TMRC20097, TMRC20084, close to E
G: hpgl0632, hpgl0652, hpgl0248, hpgl0659
H: hpgl0654, hpgl0634, hpgl0243, hpgl0243, closest to G
I: hpgl0242, hpgl0322, hpgl0636, hpgl0663, hpgl0638, close to H
J: TMRC20017, TMRC20033, TMRC20053, TMRC20063, TMRC20056, TMRC20074, TMRC20055, TMRC20022, TMRC20026, TMRC20083, TMRC20077, TMRC20060
K: TMRC20050, TMRC20042, TMRC20078, TMRC20049, TMRC20069, TMRC20044, close to J
L: TMRC20076, TMRC20024, TMRC2009
M: TMRC20019, TMRC20020, TMRC20031, TMRC20014, TMRC20011, close to L
N: TMRC20096, TMRC20081, TMRC20110, TMRC20092, TMRC20088, TMRC20101, TMRC20106, TMRC20091, TMRC20109, TMRC20087, TMRC20086, closeish to M
O: TMRC20095, TMRC20016, TMRC20018, quite far from everyone
P: TMRC20082, TMRC20075, pretty separate too
Q: hpgl0246, hpgl0653, hpgl0633, hpgl0244, hpgl0635, hpgl0655, hpgl0639, hpgl0662
R: TMRC20059, TMRC20089, TMRC20021, TMRC20048, TMRC20067
S: TMRC20013, TMRC20010, TMRC20037, TMRC20066, TMRC20062, TMRC20038, close to R
T: TMRC20015, TMRC20108, TMRC20099, TMRC20102, TMRC20085, TMRC20090, TMRC20104, TMRC20098, TMRC20100, TMRC20107
U: TMRC20047, TMRC20068, TMRC20080, TMRC20105, TMRC20094, TMRC20065, TMRC20071, TMRC20064, TMRC20043, TMRC20070, TMRC20062, TMRC20051, TMRC20079, TMRC20073, TMRC20058, TMRC20054

12 Macrophage data

All of the above focused entire on the parasite samples, now let us pull up the macrophage infected samples. This will comprise two datasets, one of the human and one of the parasite.

12.1 Macrophage host data

The metadata for the macrophage samples contains a couple of columns for mapped human and parasite reads. We will therefore use them separately to create two expressionsets, one for each species.

hs_annot <- load_biomart_annotations(year = "2020", month = 4)

## Using mart: ENSEMBL_MART_ENSEMBL from host: apr2020.archive.ensembl.org.

## Successfully connected to the hsapiens_gene_ensembl database.

## Finished downloading ensembl gene annotations.

## Finished downloading ensembl structure annotations.

## symbol columns is null, pattern matching 'symbol' and taking the first.

## Including symbols, there are 67149 vs the 249740 gene annotations.

## Not dropping haplotype chromosome annotations, set drop_haplotypes = TRUE if this is bad.

## Saving annotations to hsapiens_biomart_annotations.rda.

## Finished save().

hs_annot <- hs_annot[["annotation"]]
hs_annot[["transcript"]] <- paste0(rownames(hs_annot), ".", hs_annot[["transcript_version"]])
rownames(hs_annot) <- make.names(hs_annot[["ensembl_gene_id"]], unique = TRUE)
rownames(hs_annot) <- paste0("gene:", rownames(hs_annot))
tx_gene_map <- hs_annot[, c("transcript", "ensembl_gene_id")]

sanitize_columns <- c("drug", "macrophagetreatment", "macrophagezymodeme")
macr_annot <- hs_annot
rownames(macr_annot) <- gsub(x = rownames(macr_annot),
                             pattern = "^gene:",
                             replacement = "")
hs_macrophage <- create_se(macrophage_sheet, gene_info = macr_annot,
                           file_column = "hg38100hisatfile") %>%
  set_conditions(fact = "macrophagetreatment") %>%
  set_batches(fact = "macrophagezymodeme") %>%
  sanitize_metadata(columns = sanitize_columns) %>%
  subset_se(nonzero = 12000)

## Reading the sample metadata.

## Did not find the column: sampleid.

## Setting the ID column to the first column.

## Did not find the condition column in the sample sheet.

## Filling it in as undefined.

## Did not find the batch column in the sample sheet.

## Filling it in as undefined.

## Checking the state of the condition column.

## Checking the state of the batch column.

## Checking the condition factor.

## The sample definitions comprises: 69 rows(samples) and 80 columns(metadata fields).

## Matched 21481 annotations and counts.

## Some annotations were lost in merging, setting them to 'undefined'.

## The final summarized experiment has 21481 rows and 80 columns.

## The numbers of samples by condition are:

## 
##      inf   inf_sb    uninf uninf_sb 
##       30       29        5        5

## The number of samples by batch are:

## 
## none z2.2 z2.3 
##   10   30   29

## Recasting the data.frame to DataFrame.

##    rownames         tubelabelorigin     samplename        numberofvials
##  Length:69          Length:69          Length:69          Min.   :1    
##  Class :character   Class :character   Class :character   1st Qu.:1    
##  Mode  :character   Mode  :character   Mode  :character   Median :1    
##                                                           Mean   :1    
##                                                           3rd Qu.:1    
##                                                           Max.   :1    
##                                                                        
##   sourcelab          expperson         cellssource        samplecollectiondate
##  Length:69          Length:69          Length:69          Min.   :20190629    
##  Class :character   Class :character   Class :character   1st Qu.:20210813    
##  Mode  :character   Mode  :character   Mode  :character   Median :20220827    
##                                                           Mean   :20212685    
##                                                           3rd Qu.:20220827    
##                                                           Max.   :20220916    
##                                                                               
##  typeofcells           donor           isolationmethod   
##  Length:69          Length:69          Length:69         
##  Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character  
##                                                          
##                                                          
##                                                          
##                                                          
##  cellspurificationmethod selectionmethod    rnapreservation   
##  Length:69               Length:69          Length:69         
##  Class :character        Class :character   Class :character  
##  Mode  :character        Mode  :character   Mode  :character  
##                                                               
##                                                               
##                                                               
##                                                               
##  rnaextractiondate   rnavolumeul rnaavailableul rnaqctesteddate   
##  Length:69          Min.   :30   Min.   : 5.2   Min.   :   42382  
##  Class :character   1st Qu.:30   1st Qu.:22.2   1st Qu.:20200114  
##  Mode  :character   Median :30   Median :23.3   Median :20205521  
##                     Mean   :30   Mean   :23.1   Mean   :19485696  
##                     3rd Qu.:30   3rd Qu.:25.6   3rd Qu.:20211111  
##                     Max.   :30   Max.   :26.2   Max.   :20211221  
##                     NA's   :41   NA's   :41     NA's   :41        
##  bioanalyzerrnangul rnaqcpassed            rin            nanodroprnangul   
##  Length:69          Length:69          Length:69          Length:69         
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##    x260280            x260230          rnausedtoconstructlibrariesul
##  Length:69          Length:69          Min.   : 2.20                
##  Class :character   Class :character   1st Qu.: 2.80                
##  Mode  :character   Mode  :character   Median : 3.41                
##                                        Mean   : 4.61                
##                                        3rd Qu.: 4.83                
##                                        Max.   :23.30                
##                                        NA's   :41                   
##  rnausedtoconstructlibrariesng libraryqctesteddate libqcpassed       
##  Min.   :  0.5                 Min.   :20200115    Length:69         
##  1st Qu.:  0.5                 1st Qu.:20200115    Class :character  
##  Median :250.3                 Median :20201221    Mode  :character  
##  Mean   :275.3                 Mean   :20205505                      
##  3rd Qu.:500.0                 3rd Qu.:20211219                      
##  Max.   :800.0                 Max.   :20211223                      
##  NA's   :41                    NA's   :42                            
##      index      libraryvolumeul libraryvolumesenttonajibslabul
##  Min.   : 1.0   Min.   :28      Min.   :15                    
##  1st Qu.: 7.0   1st Qu.:28      1st Qu.:15                    
##  Median :14.5   Median :28      Median :15                    
##  Mean   :13.9   Mean   :28      Mean   :15                    
##  3rd Qu.:20.2   3rd Qu.:28      3rd Qu.:15                    
##  Max.   :27.0   Max.   :28      Max.   :15                    
##  NA's   :41     NA's   :41      NA's   :41                    
##   shipmentdate         oldnew          countersampleatcideimul       drug   
##  Min.   :20200217   Length:69          Min.   :13              antimony:34  
##  1st Qu.:20200217   Class :character   1st Qu.:13              none    :35  
##  Median :20210558   Mode  :character   Median :13                           
##  Mean   :20210188                      Mean   :13                           
##  3rd Qu.:20220103                      3rd Qu.:13                           
##  Max.   :20220103                      Max.   :13                           
##  NA's   :41                            NA's   :56                           
##  descriptonandremarks observation       
##  Length:69            Length:69         
##  Class :character     Class :character  
##  Mode  :character     Mode  :character  
##                                         
##                                         
##                                         
##                                         
##  librarybioanalyzerprofileelsayedlabfilenamewelllane libraryconcnm  
##  Length:69                                           Min.   : 22.1  
##  Class :character                                    1st Qu.: 57.8  
##  Mode  :character                                    Median : 98.7  
##                                                      Mean   : 96.2  
##                                                      3rd Qu.:112.8  
##                                                      Max.   :218.0  
##                                                      NA's   :55     
##  samplefor100ul2or4nmsequencing waterfor100ul2or4nmsequencing
##  Min.   :0.917                  Min.   :92.0                 
##  1st Qu.:1.754                  1st Qu.:96.9                 
##  Median :1.942                  Median :98.1                 
##  Mean   :2.995                  Mean   :97.0                 
##  3rd Qu.:3.082                  3rd Qu.:98.2                 
##  Max.   :8.000                  Max.   :99.1                 
##  NA's   :56                     NA's   :56                   
##  sequencingorderno   seqorderdate      seqcompletedate      totalreads      
##  Length:69          Min.   :20200901   Min.   :20200910   Min.   :12254196  
##  Class :character   1st Qu.:20200901   1st Qu.:20200910   1st Qu.:21496945  
##  Mode  :character   Median :20200901   Median :20200910   Median :23391483  
##                     Mean   :20202287   Mean   :20202296   Mean   :29119440  
##                     3rd Qu.:20200901   3rd Qu.:20200910   3rd Qu.:27612540  
##                     Max.   :20210601   Max.   :20210610   Max.   :86048061  
##                     NA's   :55         NA's   :55                           
##   trimmedreads       percentkept    hg38100salmonfile  hg38100hisatfile  
##  Min.   :10400801   Min.   :0.735   Length:69          Length:69         
##  1st Qu.:19375511   1st Qu.:0.887   Class :character   Class :character  
##  Median :21401552   Median :0.902   Mode  :character   Mode  :character  
##  Mean   :26367248   Mean   :0.903                                        
##  3rd Qu.:25048428   3rd Qu.:0.940                                        
##  Max.   :79775170   Max.   :0.945                                        
##                                                                          
##  hisatsinglemappedhg38 hisatmultimappedhg38 hisatmappingratehg38
##  Min.   :  501881      Min.   : 328180      Min.   :0.0418      
##  1st Qu.:17620997      1st Qu.: 605198      1st Qu.:0.9114      
##  Median :18986346      Median : 682134      Median :0.9606      
##  Mean   :23074608      Mean   :1339401      Mean   :0.9223      
##  3rd Qu.:22472518      3rd Qu.: 830271      3rd Qu.:0.9787      
##  Max.   :70100660      Max.   :7030835      Max.   :0.9885      
##                                                                 
##  lpanamensisv36hisatfile hisatlpsinglemapped hisatlpmultimapped
##  Length:69               Min.   :    199     Min.   :    14    
##  Class :character        1st Qu.:  11504     1st Qu.:   770    
##  Mode  :character        Median : 284271     Median : 17386    
##                          Mean   : 909574     Mean   : 70729    
##                          3rd Qu.:1006681     3rd Qu.: 81008    
##                          Max.   :7086371     Max.   :620799    
##                                                                
##  parasitemappingrate parasitehostratio      x68            macrophagetreatment
##  Min.   :0.000011    Min.   :0.000204   Length:69          inf     :30        
##  1st Qu.:0.000487    1st Qu.:0.003393   Class :character   inf_sb  :29        
##  Median :0.010078    Median :0.003393   Mode  :character   uninf   : 5        
##  Mean   :0.036938    Mean   :0.010336                      uninf_sb: 5        
##  3rd Qu.:0.048453    3rd Qu.:0.003393                                         
##  Max.   :0.292395    Max.   :0.155351                                         
##                                                                               
##  macrophagezymodeme   strainid            slr1fwd          slr1rc   
##  none:10            Length:69          Min.   : 0.00   Min.   :  0  
##  z22 :30            Class :character   1st Qu.: 0.00   1st Qu.:  0  
##  z23 :29            Mode  :character   Median : 0.00   Median :  6  
##                                        Mean   : 1.16   Mean   : 31  
##                                        3rd Qu.: 1.00   3rd Qu.: 27  
##                                        Max.   :11.00   Max.   :641  
##                                                                     
##     slr2fwd           slr2rc           slsum          slvsreads       
##  Min.   :     2   Min.   : 0.000   Min.   :     2   Min.   :1.03e-07  
##  1st Qu.:   224   1st Qu.: 0.000   1st Qu.:   225   1st Qu.:7.81e-06  
##  Median :  4249   Median : 0.000   Median :  4300   Median :1.83e-04  
##  Mean   : 17256   Mean   : 0.667   Mean   : 17289   Mean   :6.68e-04  
##  3rd Qu.: 22089   3rd Qu.: 0.000   3rd Qu.: 22188   3rd Qu.:8.17e-04  
##  Max.   :168826   Max.   :13.000   Max.   :169487   Max.   :6.57e-03  
##                                                                       
##    slvshuman        trimomatic_input   trimomatic_output  trimomatic_percent
##  Min.   :1.05e-07   Length:69          Length:69          Length:69         
##  1st Qu.:1.06e-05   Class :character   Class :character   Class :character  
##  Median :1.87e-04   Mode  :character   Mode  :character   Mode  :character  
##  Mean   :8.21e-04                                                           
##  3rd Qu.:8.79e-04                                                           
##  Max.   :1.02e-02                                                           
##                                                                             
##  fastqc_pct_gc      hisat_genome_single_concordant
##  Length:69          Length:69                     
##  Class :character   Class :character              
##  Mode  :character   Mode  :character              
##                                                   
##                                                   
##                                                   
##                                                   
##  hisat_genome_multi_concordant hisat_genome_single_all hisat_genome_multi_all
##  Length:69                     Length:69               Length:69             
##  Class :character              Class :character        Class :character      
##  Mode  :character              Mode  :character        Mode  :character      
##                                                                              
##                                                                              
##                                                                              
##                                                                              
##  hisat_genome_percent hisat_count_table   condition            batch          
##  Length:69            Length:69          Length:69          Length:69         
##  Class :character     Class :character   Class :character   Class :character  
##  Mode  :character     Mode  :character   Mode  :character   Mode  :character  
##                                                                               
##                                                                               
##                                                                               
##

## The samples (and read coverage) removed when filtering 12000 non-zero genes are:

## TMRC30162 
##    521145 
## TMRC30162 
##     10208

## Samples removed: 10208

fixed_genenames <- gsub(x = rownames(assay(hs_macrophage)), pattern = "^gene:",
                        replacement = "")
hs_macrophage <- set_genenames(hs_macrophage, ids = fixed_genenames)
table(colData(hs_macrophage)$condition)

## 
##      inf   inf_sb    uninf uninf_sb 
##       29       29        5        5

## The following 3 lines were copy/pasted to datastructures and should be removed soon.
nostrain <- is.na(colData(hs_macrophage)[["strainid"]])
colData(hs_macrophage)[nostrain, "strainid"] <- "none"

colData(hs_macrophage)[["strain_zymo"]] <- paste0("s", colData(hs_macrophage)[["strainid"]],
                                                "_", colData(hs_macrophage)[["macrophagezymodeme"]])
uninfected <- colData(hs_macrophage)[["strain_zymo"]] == "snone_none"
colData(hs_macrophage)[uninfected, "strain_zymo"] <- "uninfected"

data_structures <- c(data_structures, "hs_macrophage")

Finally, split off the U937 samples.

hs_u937 <- subset_se(hs_macrophage, subset = "typeofcells!='Macrophages'")
data_structures <- c(data_structures, "hs_u937")

12.2 Macrophage parasite data

In the previous block, we used a new invocation of ensembl-derived annotation data, this time we can just use our existing parasite gene annotations.

lp_macrophage <- create_se(macrophage_sheet, file_column = "lpanamensisv36hisatfile",
                           gene_info = all_lp_annot,
                           savefile = glue("rda/lp_macrophage-v{ver}.rda"),
                           annotation = "org.Lpanamensis.MHOMCOL81L13.v46.eg.db") %>%
  set_conditions(fact = "macrophagezymodeme") %>%
  set_batches(fact = "macrophagetreatment")

## Reading the sample metadata.

## Did not find the column: sampleid.

## Setting the ID column to the first column.

## Did not find the condition column in the sample sheet.

## Filling it in as undefined.

## Did not find the batch column in the sample sheet.

## Filling it in as undefined.

## Checking the state of the condition column.

## Checking the state of the batch column.

## Checking the condition factor.

## The sample definitions comprises: 69 rows(samples) and 80 columns(metadata fields).

## Warning in create_se(macrophage_sheet, file_column = "lpanamensisv36hisatfile",
## : Some samples were removed when cross referencing the samples against the
## count data.

## Matched 8778 annotations and counts.

## The final summarized experiment has 8778 rows and 80 columns.

## The numbers of samples by condition are:

## 
## none z2.2 z2.3 
##    8   29   29

## The number of samples by batch are:

## 
##      inf   inf_sb    uninf uninf_sb 
##       29       29        4        4

unfilt_written <- write_se(
  lp_macrophage,
  excel = glue("analyses/macrophage_de/{ver}/read_counts/lp_macrophage_reads_unfiltered-v{ver}.xlsx"))

## Writing the first sheet, containing a legend and some summary data.

## Warning in as.data.frame.DataFrame(pData(se), strinsAsFactors = FALSE):
## arguments in '...' ignored

## The following samples have less than 5705.7 genes.

##  [1] "TMRC30066" "TMRC30117" "TMRC30244" "TMRC30246" "TMRC30249" "TMRC30266"
##  [7] "TMRC30268" "TMRC30326" "TMRC30323" "TMRC30319" "TMRC30325" "TMRC30327"
## [13] "TMRC30312" "TMRC30300" "TMRC30304" "TMRC30302" "TMRC30313" "TMRC30309"
## [19] "TMRC30292" "TMRC30331" "TMRC30332" "TMRC30330"

## Scale for colour is already present.
## Adding another scale for colour, which will replace the existing scale.

## Scale for fill is already present.
## Adding another scale for fill, which will replace the existing scale.

## Warning in fortify(data, ...): Arguments in `...` must be used.
## x Problematic argument:
## * colour = colors
## i Did you misspell an argument name?

## 175550 entries are 0.  We are on a log scale, adding 1 to the data.
## Naively calculating coefficient of variation/dispersion with respect to condition.
## Finished calculating dispersion estimates.
## `geom_smooth()` using formula = 'y ~ x'This dataset does not support lmer with condition+batch
## Removing 0 low-count genes (8778 remaining).
## transform_counts: Found 175550 values equal to 0, adding 1 to the matrix.
## `geom_smooth()` using formula = 'y ~ x'The factor none has 8 rows.
## The factor z2.2 has 29 rows.
## The factor z2.3 has 29 rows.

lp_macrophage_filt <- subset_se(lp_macrophage, nonzero = 2500)

## The samples (and read coverage) removed when filtering 2500 non-zero genes are:

## TMRC30066 TMRC30117 TMRC30244 TMRC30246 TMRC30266 TMRC30268 TMRC30326 TMRC30323 
##      3080      1147      1662      2834       822      3444       375        84 
## TMRC30319 TMRC30325 TMRC30327 TMRC30312 TMRC30304 TMRC30313 TMRC30309 TMRC30330 
##       374       356       129        76       289        96       188       181 
## TMRC30066 TMRC30117 TMRC30244 TMRC30246 TMRC30266 TMRC30268 TMRC30326 TMRC30323 
##      1890       888      1135      1796       649      1915       303        74 
## TMRC30319 TMRC30325 TMRC30327 TMRC30312 TMRC30304 TMRC30313 TMRC30309 TMRC30330 
##       270       279       123        76       207        84       166       135

## Samples removed: 1890, 888, 1135, 1796, 649, 1915, 303, 74, 270, 279, 123, 76, 207, 84, 166, 135

##  semantic_filter(semantic = c("amastin", "gp63", "leishmanolysin"),
##                  semantic_column = "annot_gene_product")
data_structures <- c(data_structures, "lp_macrophage", "lp_macrophage_filt")
filt_written <- write_se(lp_macrophage_filt,
  excel = glue("analyses/macrophage_de/{ver}/read_counts/lp_macrophage_reads_filtered-v{ver}.xlsx"))

## Writing the first sheet, containing a legend and some summary data.

## Warning in as.data.frame.DataFrame(pData(se), strinsAsFactors = FALSE):
## arguments in '...' ignored

## The following samples have less than 5705.7 genes.

## [1] "TMRC30249" "TMRC30300" "TMRC30302" "TMRC30292" "TMRC30331" "TMRC30332"

## Scale for colour is already present.
## Adding another scale for colour, which will replace the existing scale.
## Scale for fill is already present.
## Adding another scale for fill, which will replace the existing scale.

## Warning in fortify(data, ...): Arguments in `...` must be used.
## x Problematic argument:
## * colour = colors
## i Did you misspell an argument name?

## 45092 entries are 0.  We are on a log scale, adding 1 to the data.
## Naively calculating coefficient of variation/dispersion with respect to condition.
## Finished calculating dispersion estimates.
## `geom_smooth()` using formula = 'y ~ x'Removing 0 low-count genes (8778 remaining).
## transform_counts: Found 45092 values equal to 0, adding 1 to the matrix.
## `geom_smooth()` using formula = 'y ~ x'The factor z2.2 has 21 rows.
## The factor z2.3 has 29 rows.

lp_macrophage <- lp_macrophage_filt

lp_macrophage_nosb <- subset_se(lp_macrophage, subset = "batch!='inf_sb'")
lp_nosb_write <- write_se(
  lp_macrophage_nosb,
  excel = glue("analyses/macrophage_de/{ver}/read_counts/lp_macrophage_nosb_reads-v{ver}.xlsx"))

## Writing the first sheet, containing a legend and some summary data.

## Warning in as.data.frame.DataFrame(pData(se), strinsAsFactors = FALSE):
## arguments in '...' ignored

## Scale for colour is already present.
## Adding another scale for colour, which will replace the existing scale.
## Scale for fill is already present.
## Adding another scale for fill, which will replace the existing scale.

## Warning in fortify(data, ...): Arguments in `...` must be used.
## x Problematic argument:
## * colour = colors
## i Did you misspell an argument name?

## 6545 entries are 0.  We are on a log scale, adding 1 to the data.

## Warning: `aes_string()` was deprecated in ggplot2 3.0.0.
## i Please use tidy evaluation idioms with `aes()`.
## i See also `vignette("ggplot2-in-packages")` for more information.
## i The deprecated feature was likely used in the directlabels package.
##   Please report the issue at <https://github.com/tdhock/directlabels/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

## Naively calculating coefficient of variation/dispersion with respect to condition.
## Finished calculating dispersion estimates.
## `geom_smooth()` using formula = 'y ~ x'The dataset has a minimal or missing set of conditions/batches.
## Removing 120 low-count genes (8658 remaining).
## transform_counts: Found 3286 values equal to 0, adding 1 to the matrix.
## `geom_smooth()` using formula = 'y ~ x'The factor z2.2 has 14 rows.
## The factor z2.3 has 15 rows.

data_structures <- c(data_structures, "lp_macrophage_nosb")

spec <- make_rnaseq_spec()
test <- sm(gather_preprocessing_metadata(macrophage_sheet, specification = spec))

13 Plot SL Reads on a per condition basis

lp_meta <- colData(lp_macrophage)
lp_meta[["slvsreads_log"]] <- log10(lp_meta[["slvsreads"]])
inf_values <- is.infinite(lp_meta[["slvsreads_log"]])
lp_meta[inf_values, "slvsreads_log"] <- -10

color_vector <- as.character(color_choices[["strain"]])
names(color_vector) <- names(color_choices[["strain"]])
color_vector <- color_vector[c("z2.2", "z2.3", "unknown")]
names(color_vector) <- c("z2.2", "z2.3", "none")
sl_violin <- ggplot(lp_meta,
                    aes(x = .data[["condition"]], y = .data[["slvsreads_log"]],
                        fill = .data[["condition"]])) +
  geom_violin() +
  geom_point() +
  scale_fill_manual(values = color_vector)
sl_violin

ggstatsplot::ggbetweenstats(as.data.frame(lp_meta), x = "condition", y = "slvsreads_log")

14 Make a silly ploidy plot

I want to make an estimate of ploidy using transcriptomic data. This is by definition a foold’s errand, but I think it might work.

lp_rpkm <- normalize(lp_se, convert = "rpkm", filter = TRUE,
                     length_column = "annot_cds_length", na_to_zero = TRUE)

## Removing 149 low-count genes (8629 remaining).

## Error in hpgl_rpkm(count_table, annotations = annotations, length_column = length_column, : There is no column, annot_cds_length, unable to make a width column.

## Exclude scaffolds
unwanted <- grepl(pattern = "SCAF", x = rowData(lp_rpkm)[["annot_gene_location_text"]])

## Error in h(simpleError(msg, call)): error in evaluating the argument 'x' in selecting a method for function 'grepl': error in evaluating the argument 'x' in selecting a method for function 'rowData': object 'lp_rpkm' not found

## I think my subset logic is bacwards...
lp_wanted <- lp_rpkm[!unwanted, ]

## Error: object 'lp_rpkm' not found

summary_df <- as.data.frame(assay(lp_wanted))

## Error in h(simpleError(msg, call)): error in evaluating the argument 'x' in selecting a method for function 'as.data.frame': error in evaluating the argument 'x' in selecting a method for function 'assay': object 'lp_wanted' not found

summary_df[["gene_mean"]] <- rowMeans(summary_df, na.rm = TRUE)

## Error: object 'summary_df' not found

summary_df[["chromosome"]] <- rowData(lp_wanted)[["annot_chromosome"]]

## Error in h(simpleError(msg, call)): error in evaluating the argument 'x' in selecting a method for function 'rowData': object 'lp_wanted' not found

summary_df[["chromosome"]] <- as.factor(summary_df[["chromosome"]])

## Error in h(simpleError(msg, call)): error in evaluating the argument 'x' in selecting a method for function 'as.factor': object 'summary_df' not found

levels(summary_df[["chromosome"]]) <- c(seq_len(19), "20.1", "20.2", 21:35)

## Error: object 'summary_df' not found

summary_df <- summary_df[, c("gene_mean", "chromosome")] %>%
  group_by(chromosome) %>%
  summarize(chr_mean = mean(gene_mean, na.rm = TRUE))

## Error: object 'summary_df' not found

min_rpkm <- min(summary_df[["chr_mean"]])

## Error: object 'summary_df' not found

summary_df[["chr_mean"]] <- summary_df[["chr_mean"]] / min_rpkm

## Error: object 'summary_df' not found

ggplot(summary_df, aes(y = chromosome, x = chr_mean)) +
  geom_col()

## Error: object 'summary_df' not found

wanted <- colData(lp_wanted)[["knnv2classification"]] == "z22" | colData(lp_wanted)[["knnv2classification"]] == "z23"

## Error in h(simpleError(msg, call)): error in evaluating the argument 'x' in selecting a method for function 'colData': object 'lp_wanted' not found

lp_z <- lp_wanted[, wanted]

## Error: object 'lp_wanted' not found

z22_samples <- colData(lp_z)[["knnv2classification"]] == "z22"

## Error in h(simpleError(msg, call)): error in evaluating the argument 'x' in selecting a method for function 'colData': object 'lp_z' not found

z23_samples <- colData(lp_z)[["knnv2classification"]] == "z23"

## Error in h(simpleError(msg, call)): error in evaluating the argument 'x' in selecting a method for function 'colData': object 'lp_z' not found

lp_z_assay <- as.data.frame(assay(lp_z))

## Error in h(simpleError(msg, call)): error in evaluating the argument 'x' in selecting a method for function 'as.data.frame': error in evaluating the argument 'x' in selecting a method for function 'assay': object 'lp_z' not found

lp_z_assay[["z22_gene_mean"]] <- rowMeans(lp_z_assay[, z22_samples], na.rm = TRUE)

## Error: object 'lp_z_assay' not found

lp_z_assay[["z23_gene_mean"]] <- rowMeans(lp_z_assay[, z23_samples], na.rm = TRUE)

## Error: object 'lp_z_assay' not found

lp_z_assay[["chromosome"]] <- rowData(lp_z)[["annot_chromosome"]]

## Error in h(simpleError(msg, call)): error in evaluating the argument 'x' in selecting a method for function 'rowData': object 'lp_z' not found

lp_z_means <- lp_z_assay[, c("z22_gene_mean", "z23_gene_mean", "chromosome")] %>%
  group_by(chromosome) %>%
  summarize(z22_mean = mean(z22_gene_mean, na.rm = TRUE),
            z23_mean = mean(z23_gene_mean, na.rm = TRUE))

## Error: object 'lp_z_assay' not found

chr_reshaped <- reshape2::melt(lp_z_means, id.vars = "chromosome")

## Error: object 'lp_z_means' not found

chr_reshaped[["chromosome"]] <- factor(chr_reshaped[["chromosome"]],
                                       levels = c(as.character(1:19), "20.1", "20.2",
                                                  as.character(21:35)))

## Error: object 'chr_reshaped' not found

putative_aneuploid <- ggplot(chr_reshaped, aes(x = value, y = chromosome)) +
  geom_bar(aes(fill = variable), position = "dodge", stat = "identity")

## Error: object 'chr_reshaped' not found

pp(file = "images/putative_aneuploid.svg")
putative_aneuploid

## Error: object 'putative_aneuploid' not found

dev.off()

## png 
##   2

putative_aneuploid

## Error: object 'putative_aneuploid' not found

15 Save all data structures into one rda

found_idx <- data_structures %in% ls()
if (sum(!found_idx) > 0) {
  not_found <- data_structures[!found_idx]
  warning("Some datastructures were not generated: ", toString(not_found), ".")
  data_structures <- data_structures[found_idx]
}

## Warning: Some datastructures were not generated: lp_lengths, meta.

save(list = data_structures, file = glue("rda/tmrc2_data_structures-v{ver}.rda"))

pander::pander(sessionInfo())

## Warning: Your system is mis-configured: '/etc/localtime' is not a symlink

## Warning: It is strongly recommended to set envionment variable TZ to
## 'America/New_York' (or equivalent)

R version 4.5.0 (2025-04-11)

Platform: x86_64-pc-linux-gnu

locale: C

attached base packages: stats4, stats, graphics, grDevices, utils, datasets, methods and base

other attached packages: ruv(v.0.9.7.1), BiocParallel(v.1.42.1), variancePartition(v.1.38.1), BSGenome.Leishmania.panamensis.MHOMCOL81L13.v68(v.2024.09), BSgenome(v.1.76.0), rtracklayer(v.1.68.0), BiocIO(v.1.18.0), Biostrings(v.2.76.0), XVector(v.0.48.0), GenomicRanges(v.1.60.0), GenomeInfoDb(v.1.44.2), org.Lpanamensis.MHOMCOL81L13.v68.eg.db(v.2024.09), AnnotationDbi(v.1.70.0), IRanges(v.2.42.0), S4Vectors(v.0.46.0), Biobase(v.2.68.0), hpgltools(v.1.2), Heatplus(v.3.16.0), ggplot2(v.4.0.0), glue(v.1.8.0), dplyr(v.1.1.4), BiocGenerics(v.0.54.0) and generics(v.0.1.4)

loaded via a namespace (and not attached): fs(v.1.6.6), matrixStats(v.1.5.0), bitops(v.1.0-9), httr(v.1.4.7), RColorBrewer(v.1.1-3), insight(v.1.4.2), doParallel(v.1.0.17), numDeriv(v.2016.8-1.1), tools(v.4.5.0), backports(v.1.5.0), R6(v.2.6.1), statsExpressions(v.1.7.1), lazyeval(v.0.2.2), mgcv(v.1.9-3), withr(v.3.0.2), prettyunits(v.1.2.0), gridExtra(v.2.3), cli(v.3.6.5), prismatic(v.1.1.2), labeling(v.0.4.3), sass(v.0.4.10), mvtnorm(v.1.3-3), S7(v.0.2.0), readr(v.2.1.5), genefilter(v.1.90.0), pbapply(v.1.7-4), Rsamtools(v.2.24.0), yulab.utils(v.0.2.1), DOSE(v.4.2.0), R.utils(v.2.13.0), dichromat(v.2.0-0.1), limma(v.3.64.3), RSQLite(v.2.4.3), gtools(v.3.9.5), vroom(v.1.6.5), zip(v.2.3.3), GO.db(v.3.21.0), Matrix(v.1.7-3), abind(v.1.4-8), R.methodsS3(v.1.8.2), lifecycle(v.1.0.4), yaml(v.2.3.10), edgeR(v.4.6.3), SummarizedExperiment(v.1.38.1), gplots(v.3.2.0), qvalue(v.2.40.0), SparseArray(v.1.8.1), BiocFileCache(v.2.16.1), Rtsne(v.0.17), paletteer(v.1.6.0), grid(v.4.5.0), blob(v.1.2.4), promises(v.1.3.3), crayon(v.1.5.3), lattice(v.0.22-7), cowplot(v.1.2.0), GenomicFeatures(v.1.60.0), annotate(v.1.86.1), KEGGREST(v.1.48.1), zeallot(v.0.2.0), pillar(v.1.11.0), knitr(v.1.50), varhandle(v.2.0.6), fgsea(v.1.34.2), rjson(v.0.2.23), boot(v.1.3-31), corpcor(v.1.6.10), codetools(v.0.2-20), fastmatch(v.1.1-6), data.table(v.1.17.8), vctrs(v.0.6.5), png(v.0.1-8), Rdpack(v.2.6.4), gtable(v.0.3.6), rematch2(v.2.1.2), datawizard(v.1.3.0), cachem(v.1.1.0), xfun(v.0.53), openxlsx(v.4.2.8), rbibutils(v.2.3), S4Arrays(v.1.8.1), mime(v.0.13), correlation(v.0.8.8), coda(v.0.19-4.1), reformulas(v.0.4.1), survival(v.3.8-3), iterators(v.1.0.14), statmod(v.1.5.0), directlabels(v.2025.6.24), nlme(v.3.1-168), pbkrtest(v.0.5.5), bit64(v.4.6.0-1), progress(v.1.2.3), EnvStats(v.3.1.0), filelock(v.1.0.3), bslib(v.0.9.0), KernSmooth(v.2.23-26), DBI(v.1.2.3), tidyselect(v.1.2.1), bit(v.4.6.0), compiler(v.4.5.0), curl(v.7.0.0), httr2(v.1.2.1), graph(v.1.86.0), xml2(v.1.4.0), DelayedArray(v.0.34.1), plotly(v.4.11.0), bayestestR(v.0.17.0), scales(v.1.4.0), caTools(v.1.18.3), remaCor(v.0.0.20), quadprog(v.1.5-8), rappdirs(v.0.3.3), stringr(v.1.5.1), digest(v.0.6.37), ggsankey(v.0.0.99999), minqa(v.1.2.8), rmarkdown(v.2.29), aod(v.1.3.3), RhpcBLASctl(v.0.23-42), htmltools(v.0.5.8.1), pkgconfig(v.2.0.3), lme4(v.1.1-37), MatrixGenerics(v.1.20.0), dbplyr(v.2.5.0), fastmap(v.1.2.0), rlang(v.1.1.6), htmlwidgets(v.1.6.4), UCSC.utils(v.1.4.0), shiny(v.1.11.1), farver(v.2.1.2), jquerylib(v.0.1.4), jsonlite(v.2.0.0), GOSemSim(v.2.34.0), R.oo(v.1.27.1), RCurl(v.1.98-1.17), magrittr(v.2.0.4), GenomeInfoDbData(v.1.2.14), patchwork(v.1.3.2), parameters(v.0.28.2), Rcpp(v.1.1.0), stringi(v.1.8.7), MASS(v.7.3-65), plyr(v.1.8.9), parallel(v.4.5.0), ggrepel(v.0.9.6), splines(v.4.5.0), pander(v.0.6.6), hms(v.1.1.3), locfit(v.1.5-9.12), fastcluster(v.1.3.0), effectsize(v.1.0.1), reshape2(v.1.4.4), biomaRt(v.2.64.0), rstantools(v.2.5.0), XML(v.3.99-0.19), evaluate(v.1.0.4), RcppParallel(v.5.1.11-1), nloptr(v.2.2.1), tzdb(v.0.5.0), foreach(v.1.5.2), httpuv(v.1.6.16), MatrixModels(v.0.5-4), BayesFactor(v.0.9.12-4.7), tidyr(v.1.3.1), purrr(v.1.1.0), broom(v.1.0.10), xtable(v.1.8-4), restfulr(v.0.0.16), fANCOVA(v.0.6-1), later(v.1.4.3), viridisLite(v.0.4.2), tibble(v.3.3.0), lmerTest(v.3.1-3), ggstatsplot(v.0.13.3), memoise(v.2.0.1), GenomicAlignments(v.1.44.0), sva(v.3.56.0) and GSEABase(v.1.70.0)

message("This is hpgltools commit: ", get_git_commit())

## If you wish to reproduce this exact build of hpgltools, invoke the following:

## > git clone http://github.com/abelew/hpgltools.git

## > git reset 159b347956b8e87168310c6d2f8096e8f512c924

## This is hpgltools commit: Mon Oct 13 17:35:31 2025 -0400: 159b347956b8e87168310c6d2f8096e8f512c924

message("Saving to ", savefile)

## Saving to 01datasets.rda.xz

# tmp <- sm(saveme(filename = savefile))

tmp <- loadme(filename = savefile)

LS0tCnRpdGxlOiAiVE1SQzIgYHIgU3lzLmdldGVudignVkVSU0lPTicpYDogRGF0YSBTZXQgQ3JlYXRpb24iCmF1dGhvcjogImF0YiBhYmVsZXdAZ21haWwuY29tIgpkYXRlOiAiYHIgU3lzLkRhdGUoKWAiCmJpYmxpb2dyYXBoeTogYXRiLmJpYgpvdXRwdXQ6CiBodG1sX2RvY3VtZW50OgogICAgY29kZV9kb3dubG9hZDogdHJ1ZQogICAgY29kZV9mb2xkaW5nOiBzaG93CiAgICBmaWdfY2FwdGlvbjogdHJ1ZQogICAgZmlnX2hlaWdodDogNwogICAgZmlnX3dpZHRoOiA3CiAgICBoaWdobGlnaHQ6IHplbmJ1cm4KICAgIGtlZXBfbWQ6IGZhbHNlCiAgICBtb2RlOiBzZWxmY29udGFpbmVkCiAgICBudW1iZXJfc2VjdGlvbnM6IHRydWUKICAgIHNlbGZfY29udGFpbmVkOiB0cnVlCiAgICB0aGVtZTogcmVhZGFibGUKICAgIHRvYzogdHJ1ZQogICAgdG9jX2Zsb2F0OgogICAgICBjb2xsYXBzZWQ6IGZhbHNlCiAgICAgIHNtb290aF9zY3JvbGw6IGZhbHNlCi0tLQoKPHN0eWxlIHR5cGU9InRleHQvY3NzIj4KYm9keSAubWFpbi1jb250YWluZXIgewogIG1heC13aWR0aDogMTYwMHB4Owp9CmJvZHksIHRkIHsKICBmb250LXNpemU6IDE2cHg7Cn0KY29kZS5yewogIGZvbnQtc2l6ZTogMTZweDsKfQpwcmUgewogIGZvbnQtc2l6ZTogMTZweAp9Cjwvc3R5bGU+CgpgYGB7ciBvcHRpb25zLCBpbmNsdWRlID0gRkFMU0V9CmxpYnJhcnkoQmlvY0dlbmVyaWNzKQpsaWJyYXJ5KGRwbHlyKQpsaWJyYXJ5KGdsdWUpCmxpYnJhcnkoZ2dwbG90MikKbGlicmFyeShIZWF0cGx1cykKbGlicmFyeShocGdsdG9vbHMpCgprbml0cjo6b3B0c19rbml0JHNldChwcm9ncmVzcyA9IFRSVUUsIHZlcmJvc2UgPSBUUlVFLCB3aWR0aCA9IDkwLCBlY2hvID0gVFJVRSkKa25pdHI6Om9wdHNfY2h1bmskc2V0KAogIGVycm9yID0gVFJVRSwgZmlnLndpZHRoID0gOSwgZmlnLmhlaWdodCA9IDksIGZpZy5yZXRpbmEgPSAyLAogIG91dC53aWR0aCA9ICIxMDAlIiwgZGV2ID0gInBuZyIsCiAgZGV2LmFyZ3MgPSBsaXN0KHBuZyA9IGxpc3QodHlwZSA9ICJjYWlyby1wbmciKSkpCm9sZF9vcHRpb25zIDwtIG9wdGlvbnMoZGlnaXRzID0gNCwgc3RyaW5nc0FzRmFjdG9ycyA9IEZBTFNFLCBrbml0ci5kdXBsaWNhdGUubGFiZWwgPSAiYWxsb3ciKQpnZ3Bsb3QyOjp0aGVtZV9zZXQoZ2dwbG90Mjo6dGhlbWVfYncoYmFzZV9zaXplID0gMTIpKQp2ZXIgPC0gU3lzLmdldGVudigiVkVSU0lPTiIpCnByZXZpb3VzX2ZpbGUgPC0gIiIKcnVuZGF0ZSA8LSBmb3JtYXQoU3lzLkRhdGUoKSwgZm9ybWF0ID0gIiVZJW0lZCIpCgpybWRfZmlsZSA8LSAiMDFkYXRhc2V0cy5SbWQiCnNhdmVmaWxlIDwtIGdzdWIocGF0dGVybiA9ICJcXC5SbWQiLCByZXBsYWNlID0gIlxcLnJkYVxcLnh6IiwgeCA9IHJtZF9maWxlKQpkYXRhX3N0cnVjdHVyZXMgPC0gYygpCmBgYAoKIyBUT0RPCgoxLiAgSGF2ZSBhIHNldCB3aGVyZSB3ZSBtZXJnZSAyLjEvMi4yLCAyLjMvMi40LgoyLiAgUmVwcmVzZW50IHRoZSB0cmFuc2l0aW9uIGZyb20gYSBnbG9iYWwgdmlldyBvZiB0aGUgc2FtcGxlcyB3aXRob3V0CiAgICBhbnkgY2xhc3NpZmljYXRpb24sIHRoZW4gc3RhdGUgdGhlIHN1YnBvcHVsYXRpb25zL3p5bW9kZW1lcywgdGhlbgogICAgYWRkIHNlbnNpdGl2aXR5L3Jlc2lzdGFuY2UsIHRoZW4gY3VyZS9mYWlsLgozLiAgUGVyaGFwcyBtYWtlIGFuIGV4cGxpY2l0IHBsb3Qgd2hlcmUgYWxsIHNhbXBsZXMgYXJlIG9uZSBjb2xvcgogICAgZXhjZXB0aW5nIGEgcmVsYXRpdmVseSBzbWFsbCBudW1iZXIgb2YgcHJldmlvdXNseSBhc3NheWVkIHNldD8KICAgIFRoZSBzYW1wbGVzIHdoaWNoIHdvdWxkIGJlIGNvbG9yZWQgaW4gdGhpcyB2aWV3IHdvdWxkIGJlIGZyb20KICAgIE9sZ2EncyAyMDE0IHBhcGVyIEkgdGhpbmsuCjQuICBNYWtlIGEgZmxvdyBkaWFncmFtIGdvaW5nIGZyb20gcy9yIC0+IHN1YnBvcHVsYXRpb24gLT4KICAgIGMvZi91LiAoc2Fua2V5KQo1LiAgTWFrZSBhIHRhYmxlIHNpbWlsYXIgdG8gdGhlIFRNUkMzIGNvbnRhaW5pbmcgdGhlIHN0YXR1c2VzIG9mIHRoZQogICAgc2FtcGxlcy4KNi4gIEV4cGxpY2l0bHkgY29uc2lkZXIgbWV0YWRhdGEgY29sdW1uICdQJyBmb3IgcmVmZXJlbmNlIHN0cmFpbnMgLS0KICAgIG1ha2UgYW4gYWxsIGdyZXkgcGxvdCB3aXRoIGEgZmV3IHNhbXBsZXMgY29sb3JlZCB0YWtlbiBmcm9tIHRoaXMKICAgIGNvbHVtbi4KCiMgQ2hhbmdlbG9nCgojIyAyMDIzMDUyNC8yMDIzMDYyOAoKKiBGcm96ZW4gbWV0YWRhdGEsIG5vdyB1c2luZyBzYW1wbGUgc2hlZXQgJ0NsaW5pY2FsU3RyYWluc19UTVJDMl9Gcm96ZW5cIDIxMDYyMDIzLnhsc3gnCgojIyAyMDIzMDQxMAoKKiBVcGRhdGluZyB0aGUgdmVyc2lvbiBudW1iZXIgZHVlIHRvIHNvbWUgbW9kZXJhdGVseSBpbnRydXNpdmUgY2hhbmdlcwogIEkgbWFkZSBpbiBvcmRlciB0byBtb3JlIGNhcmVmdWxseSBjcmVhdGUgcGxvdHMgb2YgdGhlIGRpZmZlcmVudGlhbAogIGV4cHJlc2lzb24gZGF0YS4gIEkgZG9uJ3QgdGhpbmsgYW55dGhpbmcgSSBkaWQgc2hvdWxkIGFjdHVhbGx5CiAgY2hhbmdlIGFueSBvZiB0aGUgZGF0YSwgYnV0IHNvbWUgb2YgdGhlIGFuYWx5c2VzIGFyZSBkZWZpbml0ZWx5CiAgYWZmZWN0ZWQgKG5vdGUgdGhhdCB0aGUgb25seSBjaGFuZ2UgaW4gcmVzdWx0cyBpcyBkdWUgdG8gYSBtaXN0YWtlIEkKICBtYWRlIGluIGRlZmluaW5nIG9uZSBvZiB0aGUgY29udHJhc3RzLCBhbGwgb3RoZXIgY2hhbmdlcyBhcmUganVzdAogIHBsb3QgYWVzdGhldGljIGltcHJvdmVtZW50cykKCiMjIDIwMjMwMjA1CgoqIERpZCB0aGUgc3R1ZmYgb24gdGhpcyBtb3JuaW5nJ3MgVE9ETyB3aGljaCBjYW1lIG91dCBvZiB0aGlzCiAgbW9ybmluZydzIG1lZXRpbmc6IGRvIGEgUENBIHdpdGhvdXQgdGhlIG9kZGJhbGwgc3RyYWlucyAoYWxyZWFkeQogIGRvbmUgaW4gdGhlIHdvcmtzaGVldCksIGhpZ2hsaWdodCByZWZlcmVuY2Ugc3RyYWlucywgYW5kIGFkZCBMLm1ham9yCiAgSURzIGFuZCBEZXNjcmlwdGlvbnMgKGRvbmUgYnkgYXBwZW5kaW5nIGEgY29sbGFwc2VkIHZlcnNpb24gb2YgdGhlCiAgb3J0aG9sb2cgZGF0YSB0byB0aGUgYWxsX2xwX2Fubm90IGRhdGEpLgoKKiBGaXhlZCBodW1hbiBJRHMgZm9yIHRoZSBtYWNyb3BoYWdlIGRhdGEuCiogQ2hhbmdlZCBpbnB1dCBtZXRhZGF0YSBzaGVldHM6IHByaW1hcmlseSBiZWNhdXNlIEkgb25seSByZW1lbWJlcmVkCiAgeWVzdGVyZGF5IHRvIGZpbmlzaCB0aGUgU0wgc2VhcmNoIGZvciBzYW1wbGVzID5UTVJDMjAwOTUuICBUaGV5IGFyZQogIHJ1bm5pbmcgbm93IGFuZCB3aWxsIGJlIGFkZGVkIG1vbWVudGFyaWx5IChJIHdpbGwgaGF2ZSB0byByZWRvd25sb2FkCiAgdGhlIHNoZWV0KS4KKiBTZXR0aW5nIHVwIHRvIG1ha2UgYSBoY2x1c3QvcGh5bG9nZW5ldGljIHRyZWUgb2Ygc3RyYWlucywgdXNlIHRoZXNlCiAgYXJlIHJlZmVyZW5jZTogMjE2OCgyLjMpLCAyMjcyKDIuMiksIGZvciBvdGhlciAyLnggY2hvb3NlCiAgYXJiaXRyYXJpbHkgKGxvd2VyIG51bWJlcnMgYXJlIGJldHRlcikuCiogQWRkZWQgYW5vdGhlciBzYW5pdGl6ZSBjb2x1bW5zIGNhbGwgZm9yIEFudGltb255IHZzLiBhbnRpbW9ueSBhbmQgTm9uZSB2cy4KICBub25lIGluIHRoZSBUTVJDMiBtYWNyb3BoYWdlIHNhbXBsZXMuCgojIEludHJvZHVjdGlvbgoKVGhpcyBkb2N1bWVudCBpcyBpbnRlbmRlZCB0byBjcmVhdGUgdGhlIGRhdGEgc3RydWN0dXJlcyB1c2VkIHRvCmV2YWx1YXRlIG91ciBUTVJDMiBzYW1wbGVzLiAgSW4gc29tZSBjYXNlcywgdGhpcyBpbmNsdWRlcyBvbmx5IHRob3NlCnNhbXBsZXMgc3RhcnRpbmcgaW4gMjAxOTsgaW4gb3RoZXIgaW5zdGFuY2VzIEkgYW0gaW5jbHVkaW5nIG91cgpwcmV2aW91cyAoMjAxNS0yMDE2KSBzYW1wbGVzLgoKSW4gYWxsIGNhc2VzIHRoZSBwcm9jZXNzaW5nIHBlcmZvcm1lZCB3YXM6CgoxLiAgRGVmYXVsdCB0cmltbWluZyB3YXMgcGVyZm9ybWVkLgoyLiAgSGlzYXQyIHdhcyB1c2VkIHRvIG1hcCB0aGUgcmVtYWluaW5nIHJlYWRzIGFnYWluc3QgdGhlIExlaXNobWFuaWEKICAgIHBhbmFtZW5zaXMgZ2Vub21lIHJldmlzaW9uIDM2LgozLiAgVGhlIGFsaWdubWVudHMgZnJvbSBoaXNhdDIgd2VyZSB1c2VkIHRvIGNvdW50IHJlYWRzL2dlbmUgYWdhaW5zdCB0aGUKICAgIHJldmlzaW9uIDM2IGFubm90YXRpb25zIHdpdGggaHRzZXEuCjQuICBUaGVzZSBhbGlnbm1lbnRzIHdlcmUgYWxzbyBwYXNzZWQgdG8gdGhlIHBpbGV1cCBmdW5jdGlvbmFsaXR5IG9mIHNhbXRvb2xzCiAgICBhbmQgdGhlIHZjZi9iY2YgdXRpbGl0aWVzIGluIG9yZGVyIHRvIG1ha2UgYSBtYXRyaXggb2YgYWxsIG9ic2VydmVkCiAgICBkaWZmZXJlbmNlcyBiZXR3ZWVuIGVhY2ggc2FtcGxlIHdpdGggcmVzcGVjdCB0byB0aGUgcmVmZXJlbmNlLgo1LiAgVGhlIGZyZWViYXllcyB2YXJpYW50IGVzdGltYXRpb24gdG9vbCB3YXMgdXNlZCBpbiBhZGRpdGlvbiB0byAjNAogICAgdG8gc2VhcmNoIGZvciB2YXJpYW50IHBvc2l0aW9ucyBpbiBhIG1vcmUgcm9idXN0IGZhc2hpb24uCjYuICBUaGUgdHJpbW1lZCByZWFkcyB3ZXJlIHBhc3NlZCB0byBrcmFrZW4yIHVzaW5nIGEgdmlyYWwgZGF0YWJhc2UgaW4KICAgIG9yZGVyIHRvIGxvb2sgZm9yIHNhbXBsZXMgd2l0aCBwb3RlbnRpYWwgTFJWIHNlcXVlbmNlLgo3LiAgQW4gZXhwbGljaXQsIGdyZXAtYmFzZWQgc2VhcmNoIGZvciBzcGxpY2VkIGxlYWRlciByZWFkcyB3YXMgdXNlZAogICAgYWdhaW5zdCBhbGwgaHVtYW4tZGVyaXZlZCBzYW1wbGVzLiAgVGhlIHJlc3VsdHMgZnJvbSB0aGlzIHdlcmUKICAgIGNvcHkvcGFzdGVkIGludG8gdGhlIHNhbXBsZSBzaGVldC4KCiMgTm90ZXMgMjAyMjEyMDYgbWVldGluZwoKSSBhbSB0aGlua2luZyB0aGF0IHRoaXMgbWVldGluZyB3aWxsIGJyaW5nIE1hcmlhIEFkZWxhaWRhIGZ1bGx5IGJhY2sKaW50byB0aGUgYW5hbHlzZXMgb2YgdGhlIHBhcmFzaXRlIGRhdGEsIGFuZCB0aGVyZWZvcmUgbWF5IGZvY3VzCnByaW1hcmlseSBvbiB0aGUgZ29hbHMgcmF0aGVyIHRoYW4gdGhlIGFuYWx5c2VzPwoKKiBNYXJpYSBBZGVsYWlkYSBtZWV0aW5nIHdpdGggT2xnbGEvTWFyaWFuYTogaW50ZWdyYXRpbmcKICB0cmFuc2NyaXB0b21pY3MvZ2Vub21pY3MgcXVlc3Rpb24uCiogUGFwZXIgb24gcmVsYXRpb25zaGlwIGJ0d24gcHJpbWFyeSBtZXRhZGF0YSBmYWN0b3JzIHZpYSB0cmFuc2NyaXB0b21lL2dlbm9tZS4KKiBTZWNvbmQgb24gZHJ1ZyBzdXNjZXB0aWJpbGl0eSB3aXRob3V0IHRob3NlIGZhY3RvcnMgKEkgdGhpbmsgdGhpcwogIG1lYW5zIHRoZSBtYWNyb3BoYWdlcykKKiBEZWZpbml0aW9uIG9mIHNwZWNpZXM/ICBNQUc6IERlZmluZSBjb25zZW5zdXMgc2VxdWVuY2VzIGZvciB2YXJpb3VzCiAgc3RyYWlucy9zcGVjaWVzLiAgV2UgZWZmZWN0aXZlbHkgaGF2ZSB0aGlzIG9uIGhhbmQsIHRob3VnaCB0aGUKICBxdWFsaXR5IG1heSBiZSBhIGxpdHRsZSBsZXNzIGdvb2QgZm9yIDIuMy4KKiBSZXN1bHRpbmcgZ29hbDogQ3JlYXRlIGEgdHJlZSBvZiB0aGUgc3RyYWlucyAoSSBhbSBqdXN0IGdvaW5nIHRvCiAgY2FsbCB6eW1vZGVtZXMgc3RyYWlucyBmcm9tIG5vdyBvbikuCioqICBXaGF0IG9yZ2FuaXNtcyB3b3VsZCB3ZSBpbmNsdWRlIGluIGEgdHJlZSB0byBkZXNjcmliZSB0aGVzZQogICAgcmVsYXRpb25zaGlwczogZ3V5YW5lbnNpcywgYnJhemlsaWVuc2lzIDI5MDQsIDIuMiwgMi4zLCAyLjEsIDIuNCwKICAgIHBhbmFtZW5zaXMgcmVmZXJlbmNlLCBwZXJ1dmlhbmlhKHNwPyBJIGhhdmUgbm90IHNlZW4gdGhpcyBnZW5vbWUpLAogICAgcGFuYW1hLCAyOTAzOyBhY3R1YWxseSB0aGlzIG1heSBiZSB0cmlja3kgYmVjYXVzZSB3ZSBoYXZlIGFsd2F5cwogICAgZG9uZSB0aGlzIHdpdGggYSBzcGVjaWZpYyByZWZlcmVuY2Ugc3RyYWluIChwYW5hbWVuc2lzIGNvbCkgd2hpY2ggaXMKICAgIG9uZSBvZiB0aGUgc3RyYWlucyBpbiB0aGUgY29tcGFyaXNvbi4gIGhtbS4uLgoqKiAgQ2hlY2sgdGhlIG1vc3QgdmFyaWFudCBzdHJhaW5zIGZvciBpZGVudGl0eSAoTHVjKQoqKiAgTWV0aG9kcyBmb3IgY3JlYXRpbmcgdHJlZSwgdHJhZGl0aW9uYWwgcGh5bG9nZW55IHZzLiB2YXJpYW50CiAgICBoY2x1c3Q/CiogUENSIHF1ZXJpZXMsIHdvcmtzIHdlbGwgaWYgb25lIHBlcmZvcm1zIHNhbmdlciBzZXF1ZW5jaW5nLgoKIyMgTXVsdGlwbGUgZGF0YXNldHMKCkluIGEgY291cGxlIG9mIGltcG9ydGFudCB3YXlzIHRoZSBUTVJDMiBkYXRhIGlzIG11Y2ggbW9yZSBjb21wbGV4IHRoYW4gdGhlClRNUkMzOgoKMS4gIEl0IGNvbXByaXNlcyBtdWx0aXBsZSwgY29tcGxldGVseSBzZXBhcmF0ZSBxdWVyaWVzOgogICAgYS4gIFNlcXVlbmNpbmcgdGhlIHBhcmFzaXRlIHNhbXBsZXMKICAgIGIuICBTZXF1ZW5jaW5nIGEgc2V0IG9mIGh1bWFuIG1hY3JvcGhhZ2Ugc2FtcGxlcyB3aGljaCB3ZXJlIGluZmVjdGVkCiAgICAgICAgd2l0aCBzcGVjaWZpYyBwYXJhc2l0ZSBzYW1wbGVzLgoyLiAgVGhlIHBhcmFzaXRlIHRyYW5zY3JpcHRvbWljIHNhbXBsZXMgY29tcHJpc2UgbXVsdGlwbGUgZGlmZmVyZW50CiAgICB0eXBlcyBvZiBxdWVyaWVzOgogICAgYS4gIERpZmZlcmVudGlhbCBleHByZXNzaW9uIHRvIGxvb2sgYXQgc3RyYWluLCBzdXNjZXB0aWJpbGl0eSwgYW5kCiAgICBjbGluaWNhbCBvdXRjb21lcy4KICAgIGIuICBJbmRpdmlkdWFsIHZhcmlhbnQgc2VhcmNoZXMgdG8gbG9vayBmb3IgcG90ZW50aWFsbHkgdXNlZnVsCiAgICBTTlBzIGZvciBjbGFzc2lmaWNhdGlvbiBvZiBwYXJhc2l0ZSBzYW1wbGVzLgozLiAgVGhlIGh1bWFuIG1hY3JvcGhhZ2Ugc2FtcGxlcyBtYXkgYmUgdXNlZCB0byBxdWVyeSBib3RoIHRoZSBob3N0CiAgICBhbmQgcGFyYXNpdGUgdHJhbnNjcmlwdG9tZXMgYmVjYXVzZSAoYXQgbGVhc3Qgd2hlbiBub3QgZHJ1ZwogICAgdHJlYXRlZCkgdGhlcmUgaXMgYSB0cmVtZW5kb3VzIHBvcHVsYXRpb24gb2YgcGFyYXNpdGUgcmVhZHMgaW4KICAgIHRoZW0uCgojIyBTYW1wbGUgc2hlZXQocykKCk91ciBzaGFyZWQgb25saW5lIHNhbXBsZSBzaGVldCBpcyBuZWFybHkgc3RhdGljIGF0IHRoZSB0aW1lIG9mIHRoaXMKd3JpdGluZyAoMjAyMjA5KSwgSSBleHBlY3QgYXQgdGhpcyBwb2ludCB0aGUgb25seSBsaWtlbHkgdXBkYXRlcyB3aWxsCmJlIHRvIGFubm90YXRlIHNvbWUgc3RyYWlucyBhcyBtb3JlIG9yIGxlc3Mgc3VzY2VwdGlibGUgdG8gZHJ1Zwp0cmVhdG1lbnQuCgpgYGB7cn0Kc2FtcGxlX3NoZWV0IDwtICJzYW1wbGVfc2hlZXRzL0NsaW5pY2FsU3RyYWluc19UTVJDMi54bHN4IgptYWNyb3BoYWdlX3NoZWV0IDwtICJzYW1wbGVfc2hlZXRzL3RtcmMyX21hY3JvcGhhZ2Vfc2FtcGxlcy54bHN4IgpgYGAKCiMjIyBNb2RpZnkgdGhlIHNhbXBsZSBzaGVldAoKVGhlIGZvbGxvd2luZyBibG9jayBwcm92aWRlcyBhbiBleGFtcGxlIGludm9jYXRpb24gb2YgaG93IEkKYXV0b21hdGljYWxseSBleHRyYWN0IHRoaW5ncyBsaWtlIHBlcmNlbnQgcmVhZHMgbWFwcGVkL3RyaW1tZWQvZXRjCmZyb20gdGhlIGxvZ3MgcHJvZHVjZWQgYnkgdHJpbW9tYXRpYy9jdXRhZGFwdC9oaXNhdC9zYWxtb24vZXRjLiAgVGhlCmNhdmVhdCBpcyB0aGF0IHRoaXMgY29udGFpbmVyIG9ubHkgaGFzIGEgc21hbGwgcG9ydGlvbiBvZiB0aGUgbWF0ZXJpYWwKYXZhaWxhYmxlIGluIHRoZSBtYWluIHdvcmtpbmcgdHJlZSwgYXMgYSByZXN1bHQgdGhlIG5ldyBjb2x1bW5zIGFkZGVkCnRvIHRoZSBzYW1wbGUgc2hlZXQgYXJlIHJlbGF0aXZlbHkgc3BhcnNlIGNvbXBhcmVkIHRvIHdoYXQgSSBnZXQgb24gbXkKY29tcHV0ZXIuCgpJbiBhZGRpdGlvbiwgYmVjYXVzZSB0aGVzZSBzYW1wbGVzIGhhdmUgZ29uZSB0aHJvdWdoIH4gMyBkaWZmZXJlbnQKdmVyc2lvbnMgb2YgbXkgcGlwZWxpbmUsIGFuZCB0aGUgY29kZSB3aGljaCBleHRyYWN0cyB0aGUgbnVtYmVycwpleHBsaWNpdGx5IGFzc3VtZXMgb25seSB0aGUgbW9zdCByZWNlbnQgdmVyc2lvbiAoYmVjYXVzZSBpdCBpcyB0aGUKYmVzdCEpLCBpdCBkb2VzIG5vdCBnZXQgb3V0IHRoZSBkYXRhIGZvciBhbGwgdGhlIHNhbXBsZXMuCgpgYGB7cn0KbW9kaWZpZWQgPC0gZ2F0aGVyX3ByZXByb2Nlc3NpbmdfbWV0YWRhdGEoc2FtcGxlX3NoZWV0LCBzcGVjaWVzID0gImxwYW5hbWVuc2lzX3YzNiIpCmBgYAoKIyBBbm5vdGF0aW9ucwoKRXZlcnl0aGluZyB3aGljaCBmb2xsb3dzIGRlcGVuZHMgb24gdGhlIEV4aXN0aW5nIFRyaVRyeXBEQiBhbm5vdGF0aW9ucyByZXZpc2lvbgo0NiwgY2lyY2EgMjAxOS4gIFRoZSBmb2xsb3dpbmcgYmxvY2sgbG9hZHMgYSBkYXRhYmFzZSBvZiB0aGVzZSBhbm5vdGF0aW9ucyBhbmQKdHVybnMgaXQgaW50byBhIG1hdHJpeCB3aGVyZSB0aGUgcm93cyBhcmUgZ2VuZXMgYW5kIGNvbHVtbnMgYXJlIGFsbCB0aGUKYW5ub3RhdGlvbiB0eXBlcyBwcm92aWRlZCBieSBUcmlUcnlwREIuCgpUaGUgc2FtZSBkYXRhYmFzZSB3YXMgdXNlZCB0byBjcmVhdGUgYSBtYXRyaXggb2Ygb3J0aG9sb2dvdXMgZ2VuZXMgYmV0d2VlbgpMLnBhbmFtZW5zaXMgYW5kIGFsbCBvZiB0aGUgb3RoZXIgc3BlY2llcyBpbiB0aGUgVHJpVHJ5cERCLgoKVGhlIHNhbWUgZGF0YWJhc2Ugb2YgYW5ub3RhdGlvbnMgYWxzbyBwcm92aWRlcyBtYXBwaW5ncyB0byB0aGUgc2V0IG9mCmFubm90YXRlZCBHTyBjYXRlZ29yaWVzIGZvciB0aGUgTC5wYW5hbWVuc2lzIGdlbm9tZSBhbG9uZyB3aXRoIGdlbmUKbGVuZ3Rocy4KClRoZSBmb2xsb3dpbmcgYmxvY2sgYXNzdW1lcyBvbmUgaGFzIGFjY2VzcyB0byB0cml0cnlwZGIub3JnLCB3aGljaCBpcwpubyBjdXJyZW50bHkgZ3VhcmFudGVlZC4gIFRodXMgSSBidW5kbGVkIGEgcHJlLWdlbmVyYXRlZCBjb3B5IG9mIHRoZQpnZW5vbWUsIFR4ZGIsIGFuZCBhbm5vdGF0aW9ucy4KCmBgYHtyLCBldmFsPUZBTFNFfQojIyBtZXRhIDwtIGRvd25sb2FkX2V1cGF0aF9tZXRhZGF0YSh3ZWJzZXJ2aWNlID0gInRyaXRyeXBkYiIsIGV1X3ZlcnNpb24gPSAidjQ2IikKbWV0YSA8LSBkb3dubG9hZF9ldXBhdGhfbWV0YWRhdGEod2Vic2VydmljZSA9ICJ0cml0cnlwZGIiKQpwYW5hbWVuc2lzX2VudHJ5IDwtIGdldF9ldXBhdGhfZW50cnkoIk1IT00iLCBtZXRhZGF0YSA9IG1ldGFbWyJ2YWxpZCJdXSkKcGFuYW1lbnNpc19kYiA8LSBtYWtlX2V1cGF0aF9vcmdkYihwYW5hbWVuc2lzX2VudHJ5KQpwYW5hbWVuc2lzX3BrZyA8LSBwYW5hbWVuc2lzX2RiW1sicGtnbmFtZSJdXQpwYWNrYWdlX25hbWUgPC0gcGFuYW1lbnNpc19kYltbInBrZ25hbWUiXV0KaWYgKGlzLm51bGwocGFuYW1lbnNpc19wa2cpKSB7CiAgcGFuYW1lbnNpc19wa2cgPC0gcGFuYW1lbnNpc19kYltbIm9yZ2RiX25hbWUiXV0KICBwYWNrYWdlX25hbWUgPC0gcGFuYW1lbnNpc19wa2cKfQp0dCA8LSBsaWJyYXJ5KHBhbmFtZW5zaXNfcGtnLCBjaGFyYWN0ZXIub25seSA9IFRSVUUpCnBhbmFtZW5zaXNfcGtnIDwtIGdldDAocGFuYW1lbnNpc19wa2cpCmFsbF9maWVsZHMgPC0gY29sdW1ucyhwYW5hbWVuc2lzX3BrZykKYWxsX2xwX2Fubm90IDwtIHNtKGxvYWRfb3JnZGJfYW5ub3RhdGlvbnMocGFuYW1lbnNpc19wa2csIGtleXR5cGUgPSAiZ2lkIikpCgpscF9nbyA8LSBsb2FkX29yZ2RiX2dvKHBhY2thZ2VfbmFtZSkKbHBfZ28gPC0gbHBfZ29bLCBjKCJHSUQiLCAiR08iKV0KbHBfbGVuZ3RocyA8LSBhbGxfbHBfYW5ub3RbLCBjKCJnaWQiLCAiYW5ub3RfY2RzX2xlbmd0aCIpXQpjb2xuYW1lcyhscF9sZW5ndGhzKSAgPC0gYygiSUQiLCAibGVuZ3RoIikKYWxsX2xwX2Fubm90W1siYW5ub3RfZ2VuZV9wcm9kdWN0Il1dIDwtIHRvbG93ZXIoYWxsX2xwX2Fubm90W1siYW5ub3RfZ2VuZV9wcm9kdWN0Il1dKQpvcnRob3MgPC0gc20oZXh0cmFjdF9ldXBhdGhfb3J0aG9sb2dzKGRiID0gcGFuYW1lbnNpc19wa2cpKQpkYXRhX3N0cnVjdHVyZXMgPC0gYyhkYXRhX3N0cnVjdHVyZXMsICJscF9sZW5ndGhzIiwgImxwX2dvIiwgImFsbF9scF9hbm5vdCIsICJtZXRhIikKYGBgCgpgYGB7cn0KYWxsX2luc3RhbGxlZCA8LSByb3duYW1lcyhpbnN0YWxsZWQucGFja2FnZXMoKSkKY2FuZGlkYXRlcyA8LSBncmVwbChwYXR0ZXJuID0gIl5vcmcuTHBhbmFtZW5zaXMuTUhPTS4qdjY4LmVnLmRiIiwgeCA9IGFsbF9pbnN0YWxsZWQpCm9yZ2RiX3BrZ19uYW1lIDwtIGFsbF9pbnN0YWxsZWRbY2FuZGlkYXRlc10KCnR0IDwtIGxpYnJhcnkob3JnZGJfcGtnX25hbWUsIGNoYXJhY3Rlci5vbmx5ID0gVFJVRSkKcGFuYW1lbnNpc19wa2cgPC0gZ2V0MChvcmdkYl9wa2dfbmFtZSkKYWxsX2ZpZWxkcyA8LSBjb2x1bW5zKHBhbmFtZW5zaXNfcGtnKQphbGxfbHBfYW5ub3QgPC0gc20obG9hZF9vcmdkYl9hbm5vdGF0aW9ucyhwYW5hbWVuc2lzX3BrZywga2V5dHlwZSA9ICJnaWQiKSkkZ2VuZXMKCmxwX2dvIDwtIGxvYWRfb3JnZGJfZ28ocGFuYW1lbnNpc19wa2cpCmxwX2dvIDwtIGxwX2dvWywgYygiR0lEIiwgIkdPIildCmxwX2xlbmd0aHMgPC0gYWxsX2xwX2Fubm90WywgYygiZ2lkIiwgImFubm90X2Nkc19sZW5ndGgiKV0KY29sbmFtZXMobHBfbGVuZ3RocykgIDwtIGMoIklEIiwgImxlbmd0aCIpCmFsbF9scF9hbm5vdFtbImFubm90X2dlbmVfcHJvZHVjdCJdXSA8LSB0b2xvd2VyKGFsbF9scF9hbm5vdFtbImFubm90X2dlbmVfcHJvZHVjdCJdXSkKZGF0YV9zdHJ1Y3R1cmVzIDwtIGMoZGF0YV9zdHJ1Y3R1cmVzLCAibHBfbGVuZ3RocyIsICJscF9nbyIsICJhbGxfbHBfYW5ub3QiLCAibWV0YSIpCmBgYAoKIyMgUmVwZWF0IGZvciB0aGUgTC5tYWpvciBhbm5vdGF0aW9ucwoKUmVjZW50bHkgdGhlcmUgd2FzIGEgcmVxdWVzdCB0byBpbmNsdWRlIHRoZSBMZWlzaG1hbmlhIG1ham9yIGdlbmUgSURzCmFuZCBkZXNjcmlwdGlvbnMuICBUaHVzIEkgd2lsbCBleHRyYWN0IHRoZW0gYWxvbmcgd2l0aCB0aGUgb3J0aG9sb2dzCmFuZCBhcHBlbmQgdGhhdCB0byB0aGUgYW5ub3RhdGlvbnMgdXNlZC4KCkhhdmluZyBzcGVudCB0aGUgdGltZSB0byBydW4gdGhlIGZvbGxvd2luZyBjb2RlLCBJIHJlYWxpemVkIHRoYXQgdGhlCm9ydGhvbG9ncyBkYXRhIHN0cnVjdHVyZSBhYm92ZSBhY3R1YWxseSBhbHJlYWR5IGhhcyB0aGUgZ2VuZSBJRHMgYW5kCmRlc2NyaXB0aW9ucy4KClRodXMgSSB3aWxsIGxlYXZlIG15IHF1ZXJ5IGluIHBsYWNlIHRvIGV4dHJhY3QgdGhlIG1ham9yIGFubm90YXRpb25zLApidXQgZm9sbG93IGl0IHVwIHdpdGggYSBjb2xsYXBzZSBvZiB0aGUgbWFqb3Igb3J0aG9sb2dzIGFuZCBhcHBlbmRpbmcKb2YgdGhhdCB0byB0aGUgcGFuYW1lbnNpcyBhbm5vdGF0aW9ucy4KCmBgYHtyIGV1cGF0aGRiX2xtYWpvciwgZXZhbD1GQUxTRX0Kb3JnZGIgPC0gIm9yZy5MbWFqb3IuRnJpZWRsaW4udjQ5LmVnLmRiIgp0dCA8LSBzbShsaWJyYXJ5KG9yZ2RiLCBjaGFyYWN0ZXIub25seSA9IFRSVUUpKQptYWpvcl9kYiA8LSBvcmcuTG1ham9yLkZyaWVkbGluLnY0OS5lZy5kYgphbGxfZmllbGRzIDwtIGNvbHVtbnMocGFuX2RiKQphbGxfbG1fYW5ub3QgPC0gc20obG9hZF9vcmdkYl9hbm5vdGF0aW9ucygKICAgIG1ham9yX2RiLAogICAga2V5dHlwZSA9ICJnaWQiLAogICAgZmllbGRzID0gYygiYW5ub3RfZ2VuZV9lbnRyZXpfaWQiLCAiYW5ub3RfZ2VuZV9uYW1lIiwKICAgICAgICAgICAgICAgImFubm90X3N0cmFuZCIsICJhbm5vdF9jaHJvbW9zb21lIiwgImFubm90X2Nkc19sZW5ndGgiLAogICAgICAgICAgICAgICAiYW5ub3RfZ2VuZV9wcm9kdWN0IikpKSRnZW5lcwoKd2FudGVkX29ydGhvc19pZHggPC0gb3J0aG9zW1siT1JUSE9MT0dTX1NQRUNJRVMiXV0gPT0gIkxlaXNobWFuaWEgbWFqb3Igc3RyYWluIEZyaWVkbGluIgpzdW0od2FudGVkX29ydGhvc19pZHgpCndhbnRlZF9vcnRob3MgPC0gb3J0aG9zW3dhbnRlZF9vcnRob3NfaWR4LCBdCndhbnRlZF9vcnRob3MgPC0gd2FudGVkX29ydGhvc1ssIGMoIkdJRCIsICJPUlRIT0xPR1NfSUQiLCAiT1JUSE9MT0dTX05BTUUiKV0KCmNvbGxhcHNlZF9vcnRob3MgPC0gd2FudGVkX29ydGhvcyAlPiUKICBncm91cF9ieShHSUQpICU+JQogIHN1bW1hcmlzZShjb2xsYXBzZWRfaWQgPSBzdHJpbmdyOjpzdHJfYyhPUlRIT0xPR1NfSUQsIGNvbGxhcHNlID0gIiA7ICIpLAogICAgICAgICAgICBjb2xsYXBzZWRfbmFtZSA9IHN0cmluZ3I6OnN0cl9jKE9SVEhPTE9HU19OQU1FLCBjb2xsYXBzZSA9ICIgOyAiKSkKYWxsX2xwX2Fubm90IDwtIG1lcmdlKGFsbF9scF9hbm5vdCwgY29sbGFwc2VkX29ydGhvcywgYnkueCA9ICJyb3cubmFtZXMiLAogICAgICAgICAgICAgICAgICAgICAgYnkueSA9ICJHSUQiLCBhbGwueCA9IFRSVUUpCnJvd25hbWVzKGFsbF9scF9hbm5vdCkgPC0gYWxsX2xwX2Fubm90W1siUm93Lm5hbWVzIl1dCmFsbF9scF9hbm5vdFtbIlJvdy5uYW1lcyJdXSA8LSBOVUxMCmRhdGFfc3RydWN0dXJlcyA8LSBjKGRhdGFfc3RydWN0dXJlcywgImxwX2xlbmd0aHMiLCAibHBfZ28iLCAiYWxsX2xwX2Fubm90IikKYGBgCgojIExvYWQgYSBnZW5vbWUKClRoZSBmb2xsb3dpbmcgYmxvY2sgbG9hZHMgdGhlIGZ1bGwgZ2Vub21lIHNlcXVlbmNlIGZvciBwYW5hbWVuc2lzLiAgV2UKbWF5IHVzZSB0aGlzIGxhdGVyIHRvIGF0dGVtcHQgdG8gZXN0aW1hdGUgUENSIHByaW1lcnMgdG8gZGlzY2VybiBzdHJhaW5zLgoKSSBhbSBub3Qgc3VyZSBob3cgdG8gaW5jcmVhc2UgdGhlIG51bWJlciBvZiBvcGVuIGZpbGVzIGluIGEgY29udGFpbmVyLAphcyBhIHJlc3VsdCB0aGlzIGRvZXMgbm90IHdvcmsuCgpgYGB7cn0KIyMgdGVzdGluZ19wYW5hbWVuc2lzIDwtIG1ha2VfZXVwYXRoX2JzZ2Vub21lKGVudHJ5ID0gcGFuYW1lbnNpc19lbnRyeSwgZXVfdmVyc2lvbiA9ICJ2NDYiKQpwa2dfY2FuZGlkYXRlcyA8LSBncmVwbCh4ID0gYWxsX2luc3RhbGxlZCwgcGF0dGVybiA9ICJCU0dlbm9tZVxcLkxlaXNobWFuaWFcXC5wYW5hbWVuc2lzLioiKQpwa2dfbmFtZSA8LSBhbGxfaW5zdGFsbGVkW3BrZ19jYW5kaWRhdGVzXVsxXQpsaWJyYXJ5KGFzLmNoYXJhY3Rlcihwa2dfbmFtZSksIGNoYXJhY3Rlci5vbmx5ID0gVFJVRSkKbHBfZ2Vub21lIDwtIGdldDAoYXMuY2hhcmFjdGVyKHBrZ19uYW1lKSkKZGF0YV9zdHJ1Y3R1cmVzIDwtIGMoZGF0YV9zdHJ1Y3R1cmVzLCAibHBfZ2Vub21lIikKYGBgCgojIEdlbmVyYXRlIEV4cHJlc3Npb25zZXRzIGFuZCBTYW1wbGUgRXN0aW1hdGlvbgoKVGhlIHByb2Nlc3Mgb2Ygc2FtcGxlIGVzdGltYXRpb24gdGFrZXMgdHdvIHByaW1hcnkgaW5wdXRzOgoKMS4gIFRoZSBzYW1wbGUgc2hlZXQsIHdoaWNoIGNvbnRhaW5zIGFsbCB0aGUgbWV0YWRhdGEgd2UgY3VycmVudGx5IGhhdmUgb24gaGFuZCwKICAgIGluY2x1ZGluZyBmaWxlbmFtZXMgZm9yIHRoZSBvdXRwdXRzIG9mICMzIGFuZCAjNCBhYm92ZS4KMi4gIFRoZSBnZW5lIGFubm90YXRpb25zLgoKQW4gZXhwcmVzc2lvblNldChvciBzdW1tYXJpemVkRXhwZXJpbWVudCkgaXMgYSBkYXRhIHN0cnVjdHVyZSB1c2VkIGluClIgdG8gZXhhbWluZSBSTkFTZXEgZGF0YS4gIEl0IGlzIGNvbXByaXNlZCBvZiBhbm5vdGF0aW9ucywgbWV0YWRhdGEsCmFuZCBleHByZXNzaW9uIGRhdGEuICBJbiB0aGUgY2FzZSBvZiBvdXIgcHJvY2Vzc2luZyBwaXBlbGluZSwgdGhlCmxvY2F0aW9uIG9mIHRoZSBleHByZXNzaW9uIGRhdGEgaXMgcHJvdmlkZWQgYnkgdGhlIGZpbGVuYW1lcyBpbiB0aGUgbWV0YWRhdGEuCgojIyBOb3RlcwoKVGhlIGZvbGxvd2luZyBzYW1wbGVzIGFyZSBtdWNoIGxvd2VyIGNvdmVyYWdlOgoKKiBUTVJDMjAwMDIKKiBUTVJDMjAwMDYKKiBUTVJDMjAwMDcKKiBUTVJDMjAwMDgKClRoZXJlIGlzIGEgc2V0IG9mIHN0cmFpbnMgd2hpY2ggYWNxdWlyZWQgcmVzaXN0YW5jZSBpbiB2aXRyby4gIFRoZXNlCmFyZSBpbmNsdWRlZCBpbiB0aGUgZGF0YXNldCwgYnV0IHRoZXJlIGFyZSBub3QgbGlrZWx5IGVub3VnaCBvZiB0aGVtCnRvIHF1ZXJ5IHRoYXQgcXVlc3Rpb24gZXhwbGljaXRseS4KCiMjIERlZmluZSBjb2xvcnMKClRoZSBmb2xsb3dpbmcgbGlzdCBjb250YWlucyB0aGUgY29sb3JzIHdlIGhhdmUgY2hvc2VuIHRvIHVzZSB3aGVuCnBsb3R0aW5nIHRoZSB2YXJpb3VzIHdheXMgb2YgZGlzY2VybmluZyB0aGUgZGF0YS4KCmBgYHtyfQpjb2xvcl9jaG9pY2VzIDwtIGxpc3QoCiAgICAic3RyYWluIiA9IGxpc3QoCiAgICAgICAgIyMgInoxLjAiID0gIiMzMzMzMzMiLCAjIyBDaGFuZ2VkIHRoaXMgdG8gJ2JyYXonIHRvIG1ha2UgaXQgZWFzaWVyIHRvIGZpbmQgdGhlbS4KICAgICAgICAiejIuMCIgPSAiIzU1NTU1NSIsCiAgICAgICAgInozLjAiID0gIiM3Nzc3NzciLAogICAgICAgICJ6Mi4xIiA9ICIjODc0NDAwIiwKICAgICAgICAiejIuMiIgPSAiIzAwMDBjYyIsCiAgICAgICAgInoyLjMiID0gIiNjYzAwMDAiLAogICAgICAgICJ6Mi40IiA9ICIjZGY3MDAwIiwKICAgICAgICAiejMuMiIgPSAiIzg4ODg4OCIsCiAgICAgICAgInoxLjAiID0gIiNjYzAwY2MiLAogICAgICAgICJ6MS41IiA9ICIjY2MwMGNjIiwKICAgICAgICAiYjI5MDQiID0gIiNjYzAwY2MiLAogICAgICAgICJ1bmtub3duIiA9ICIjY2JjYmNiIiksCiAgICAjIyAibnVsbCIgPSAiIzAwMDAwMCIpLAogICAgInp5bW8iID0gbGlzdCgKICAgICAgInoyMiIgPSAiIzAwMDBjYyIsCiAgICAgICJ6MjMiID0gIiNjYzAwMDAiKSwKICAgICJjZiIgPSBsaXN0KAogICAgICAgICJjdXJlIiA9ICIjMDA2ZjAwIiwKICAgICAgICAiZmFpbCIgPSAiIzlkZmZhMCIsCiAgICAgICAgInVua25vd24iID0gIiNjYmNiY2IiLAogICAgICAgICJub3RhcHBsaWNhYmxlIiA9ICIjMDAwMDAwIiksCiAgICAic3VzY2VwdGliaWxpdHkiID0gbGlzdCgKICAgICAgICAicmVzaXN0YW50IiA9ICIjODU2M2E3IiwKICAgICAgICAic2Vuc2l0aXZlIiA9ICIjOGQwMDAwIiwKICAgICAgICAiYW1iaWd1b3VzIiA9ICIjY2JjYmNiIiwKICAgICAgICAidW5rbm93biIgPSAiIzU1NTU1NSIpKQpkYXRhX3N0cnVjdHVyZXMgPC0gYyhkYXRhX3N0cnVjdHVyZXMsICJjb2xvcl9jaG9pY2VzIikKYGBgCgojIFBhcmFzaXRlLW9ubHkgZGF0YSBzdHJ1Y3R1cmUKClRoZSBkYXRhIHN0cnVjdHVyZSAnbHBfc2UnIGNvbnRhaW5zIHRoZSBkYXRhIGZvciBhbGwgc2FtcGxlcyB3aGljaApoYXZlIGhpc2F0MiBjb3VudCB0YWJsZXMsIGFuZCB3aGljaCBwYXNzIGEgZmV3IGluaXRpYWwgcXVhbGl0eSB0ZXN0cwooZS5nLiB0aGV5IG11c3QgaGF2ZSBtb3JlIHRoYW4gODU1MCBnZW5lcyB3aXRoID4wIGNvdW50cyBhbmQgPjVlNgpyZWFkcyB3aGljaCBtYXBwZWQgdG8gYSBnZW5lKTsgZ2VuZXMgd2hpY2ggYXJlIGFubm90YXRlZCB3aXRoIGEgZmV3CmtleSByZWR1bmRhbnQgY2F0ZWdvcmllcyAobGVpc2htYW5vbHlzaW4gZm9yIGV4YW1wbGUpIGFyZSBhbHNvIGN1bGxlZC4KCiMjIEFsbCAoYWxtb3N0KSBzYW1wbGVzCgpUaGVyZSBhcmUgYSBmZXcgbWV0YWRhdGEgY29sdW1ucyB3aGljaCB3ZSByZWFsbHkgd2FudCB0byBtYWtlIGNlcnRhaW4KYXJlIHN0YW5kYXJkaXplZC4KCk5vdGU6IEkgY2hhbmdlZCB0aGlzIHRvIHByaW50IGJvdGggdGhlIG51bWJlciBvZiByZWFkcyBhbmQgZ2VuZXMgZm9yIHJlbW92ZWQgc2FtcGxlcy4KCjIwMjUxMDogQ29tbWVudGluZyBvdXQgdGhlIHNlbWFudGljIGZpbHRlciBhbmQgd2lsbCBlaXRoZXIgbm90IGFwcGx5Cml0IG9yIG1vdmUgaXQgdG8gc29tZXdoZXJlIGFmdGVyIHRoZSB2aXN1YWxpemF0aW9uIG9mIHRoZSBkYXRhLgoKYGBge3J9CnNhbml0aXplX2NvbHVtbnMgPC0gYygicGFzc2FnZW51bWJlciIsICJjbGluaWNhbHJlc3BvbnNlIiwgImNsaW5pY2FsY2F0ZWdvcmljYWwiLAogICAgICAgICAgICAgICAgICAgICAgInp5bW9kZW1lY2F0ZWdvcmljYWwiLCAiaW5jbHVkZWQiKQpscF9zZSA8LSBjcmVhdGVfc2Uoc2FtcGxlX3NoZWV0LAogICAgICAgICAgICAgICAgICAgZ2VuZV9pbmZvID0gYWxsX2xwX2Fubm90LAogICAgICAgICAgICAgICAgICAgYW5ub3RhdGlvbl9uYW1lID0gb3JnZGJfcGtnX25hbWUsCiAgICAgICAgICAgICAgICAgICBzYXZlZmlsZSA9IGdsdWUoInJkYS90bXJjMl9scF9zZV9hbGxfcmF3LXZ7dmVyfS5yZGEiKSwKICAgICAgICAgICAgICAgICAgIGlkX2NvbHVtbiA9ICJocGdsaWRlbnRpZmllciIsCiAgICAgICAgICAgICAgICAgICBmaWxlX2NvbHVtbiA9ICJscGFuYW1lbnNpc3YzNmhpc2F0ZmlsZSIpICU+JQogIHNldF9jb25kaXRpb25zKGZhY3QgPSAienltb2RlbWVjYXRlZ29yaWNhbCIsIGNvbG9ycyA9IGNvbG9yX2Nob2ljZXNbWyJzdHJhaW4iXV0pICU+JQojIyAgc2VtYW50aWNfZmlsdGVyKHNlbWFudGljID0gYygiYW1hc3RpbiIsICJncDYzIiwgImxlaXNobWFub2x5c2luIiksCiMjICAgICAgICAgICAgICAgICAgICAgICBzZW1hbnRpY19jb2x1bW4gPSAiYW5ub3RfZ2VuZV9wcm9kdWN0IikgJT4lCiAgc2FuaXRpemVfbWV0YWRhdGEoY29sdW1ucyA9IHNhbml0aXplX2NvbHVtbnMpICU+JQogIHN1YnNldF9zZShzdWJzZXQgPSAiaW5jbHVkZWQ9PSd5ZXMnIikgJT4lCiAgc2V0X2ZhY3RvcnMoY29sdW1ucyA9IHNhbml0aXplX2NvbHVtbnMsIGNsYXNzID0gImZhY3RvciIpCmRhdGFfc3RydWN0dXJlcyA8LSBjKGRhdGFfc3RydWN0dXJlcywgImxwX3NlIikKc2F2ZShsaXN0ID0gImxwX3NlIiwgZmlsZSA9IGdsdWUoInJkYS90bXJjMl9scF9zZV9hbGxfc2FuaXRpemVkLXZ7dmVyfS5yZGEiKSkKCnRhYmxlKGNvbERhdGEobHBfc2UpW1sienltb2RlbWVjYXRlZ29yaWNhbCJdXSkKdGFibGUoY29sRGF0YShscF9zZSlbWyJjbGluaWNhbHJlc3BvbnNlIl1dKQp0YWJsZShjb2xEYXRhKGxwX3NlKVtbImNsaW5pY2FsY2F0ZWdvcmljYWwiXV0pCm5jb2woYXNzYXkobHBfc2UpKQpgYGAKCiMjIFByaW50IHNhbXBsZSBJRHMgYnkgc3RhdHVzCgojIyMgQ3VyZQoKYGBge3J9CmN1cmVfaWRzIDwtIGNvbERhdGEobHBfc2UpW1siY2xpbmljYWxjYXRlZ29yaWNhbCJdXSA9PSAiY3VyZSIKcm93bmFtZXMoY29sRGF0YShscF9zZSkpW2N1cmVfaWRzXQpgYGAKCiMjIyBGYWlsCgpgYGB7cn0KZmFpbF9pZHMgPC0gY29sRGF0YShscF9zZSlbWyJjbGluaWNhbGNhdGVnb3JpY2FsIl1dID09ICJmYWlsIgpyb3duYW1lcyhjb2xEYXRhKGxwX3NlKSlbZmFpbF9pZHNdCmBgYAoKIyMjIFVua25vd24KCmBgYHtyfQp1bmtub3duX2lkcyA8LSBjb2xEYXRhKGxwX3NlKVtbImNsaW5pY2FsY2F0ZWdvcmljYWwiXV0gPT0gInVua25vd24iCnJvd25hbWVzKGNvbERhdGEobHBfc2UpKVt1bmtub3duX2lkc10KYGBgCgojIyMgU3VzY2VwdGlibGUgYW5kIHN0cmFpbgoKYGBge3J9CmFsbF9zZW5zaXRpdmVfaWRzIDwtIGNvbERhdGEobHBfc2UpW1sicXVhbGl0YXRpdmVjbGFzc2lmaWNhdGlvbm9mZHJ1Z3N1c2NlcHRpYmlsaXR5Il1dID09ICJTZW5zaXRpdmUiCnNlbnNpdGl2ZV9pZHMgPC0gcm93bmFtZXMoY29sRGF0YShscF9zZSkpW2FsbF9zZW5zaXRpdmVfaWRzXQpzZW5zaXRpdmVfaWRzCgphbGxfcmVzaXN0YW50X2lkcyA8LSBjb2xEYXRhKGxwX3NlKVtbInF1YWxpdGF0aXZlY2xhc3NpZmljYXRpb25vZmRydWdzdXNjZXB0aWJpbGl0eSJdXSA9PSAiUmVzaXN0YW50IgpyZXNpc3RhbnRfaWRzIDwtIHJvd25hbWVzKGNvbERhdGEobHBfc2UpKVthbGxfcmVzaXN0YW50X2lkc10KcmVzaXN0YW50X2lkcwoKYWxsX3oyMyA8LSBjb2xEYXRhKGxwX3NlKVtbInp5bW9kZW1lY2F0ZWdvcmljYWwiXV0gPT0gInoyMyIKejIzX2lkcyA8LSByb3duYW1lcyhjb2xEYXRhKGxwX3NlKSlbYWxsX3oyM10KejIzX2lkcwoKYWxsX3oyMiA8LSBjb2xEYXRhKGxwX3NlKVtbInp5bW9kZW1lY2F0ZWdvcmljYWwiXV0gPT0gInoyMiIKejIyX2lkcyA8LSByb3duYW1lcyhjb2xEYXRhKGxwX3NlKSlbYWxsX3oyMl0KejIyX2lkcwoKYm90aF9pZHMgPC0gejIyX2lkcyAlaW4lIHJlc2lzdGFudF9pZHMKc3VtbWFyeShib3RoX2lkcykKcm93bmFtZXMoY29sRGF0YShscF9zZSkpW2JvdGhfaWRzXQoKYm90aF9pZHMgPC0gejIzX2lkcyAlaW4lIHNlbnNpdGl2ZV9pZHMKc3VtbWFyeShib3RoX2lkcykKYGBgCgpBbGwgdGhlIGZvbGxvd2luZyBkYXRhIHdpbGwgZGVyaXZlIGZyb20gdGhpcyBzdGFydGluZyBwb2ludC4KCiMjIEV4dHJhY3Qgc2FtcGxlcyBmcm9tIG9ubHkgdGhlIHR3byAnY2Fub25pY2FsJyBzdHJhaW5zCgojIyMgUXVpY2sgZGl2ZXJnZW5jZQoKSGVyZSBpcyBhIHRhYmxlIG9mIG15IGN1cnJlbnQgY2xhc3NpZmllcidzIGludGVycHJldGF0aW9uIG9mIHRoZSBzdHJhaW5zLgoKYGBge3J9CnRhYmxlKGNvbERhdGEobHBfc2UpW1sia25udjJjbGFzc2lmaWNhdGlvbiJdXSkKYGBgCgojIyMgTWVyZ2UgMi4xLzIuMiBhbmQgMi40LzIuMwoKYGBge3J9Cm1lcmdlZF96eW1vIDwtIGxwX3NlCmNvbERhdGEobWVyZ2VkX3p5bW8pW1sienltb2RlbWUiXV0gPC0gYXMuY2hhcmFjdGVyKGNvbERhdGEobWVyZ2VkX3p5bW8pW1sienltb2RlbWVjYXRlZ29yaWNhbCJdXSkKejIxX2lkeCA8LSBjb2xEYXRhKG1lcmdlZF96eW1vKVtbInp5bW9kZW1lIl1dID09ICJ6MjEiCmNvbERhdGEobWVyZ2VkX3p5bW8pW3oyMV9pZHgsICJ6eW1vZGVtZSJdIDwtICJ6MjIiCgp6MjRfaWR4IDwtIGNvbERhdGEobWVyZ2VkX3p5bW8pW1sienltb2RlbWUiXV0gPT0gInoyNCIKY29sRGF0YShtZXJnZWRfenltbylbejI0X2lkeCwgInp5bW9kZW1lIl0gPC0gInoyMyIKCmtlZXBlcnMgPC0gY29sRGF0YShtZXJnZWRfenltbylbWyJ6eW1vZGVtZSJdXSA9PSAiejIyIiB8CiAgY29sRGF0YShtZXJnZWRfenltbylbWyJ6eW1vZGVtZSJdXSA9PSAiejIzIgptZXJnZWRfenltbyA8LSBtZXJnZWRfenltb1ssIGtlZXBlcnNdICU+JQogIHNldF9jb25kaXRpb25zKGZhY3QgPSAienltb2RlbWUiLCBjb2xvcnMgPSBjb2xvcl9jaG9pY2VzW1sienltbyJdXSkKYGBgCgojIEFkZCBsaWJyYXJ5IHNpemVzIGJlZm9yZSBmaWx0ZXJpbmcKCmBgYHtyfQp0YWJsZShjb2xEYXRhKGxwX3NlKVtbImNsaW5pY2FsY2F0ZWdvcmljYWwiXV0pCnVua25vd25faWRzIDwtIGNvbERhdGEobHBfc2UpW1siY2xpbmljYWxjYXRlZ29yaWNhbCJdXSA9PSAidW5rbm93biIKcm93bmFtZXMoY29sRGF0YShscF9zZSkpW3Vua25vd25faWRzXQpmYWlsZWRfaWRzIDwtIGNvbERhdGEobHBfc2UpW1siY2xpbmljYWxjYXRlZ29yaWNhbCJdXSA9PSAiZmFpbCIKcm93bmFtZXMoY29sRGF0YShscF9zZSkpW2ZhaWxlZF9pZHNdCgpwcmVfbGlic2l6ZSA8LSBwbG90X2xpYnNpemUobHBfc2UpCnByZV9saWJzaXplCgpwZGYoZmlsZSA9ICJmaWd1cmVzL2xpYnJhcnlfc2l6ZV9wcmVfZmlsdGVyLnBkZiIsIHdpZHRoID0gMjQsIGhlaWdodCA9IDEyKQpwcmVfbGlic2l6ZSRwbG90CmRldi5vZmYoKQoKcHJlX25vbnplcm8gPC0gcGxvdF9ub256ZXJvKGxwX3NlLCB5X2ludGVyY2VwdCA9IDAuOTkpCnByZV9ub256ZXJvCnBkZihmaWxlID0gImZpZ3VyZXMvbm9uemVyb19wcmVfZmlsdGVyLnBkZiIpCnByZV9ub256ZXJvJHBsb3QKZGV2Lm9mZigpCgpscF9zZV9wcmUgPC0gbHBfc2UKbHBfc2UgPC0gc3Vic2V0X3NlKGxwX3NlLCBub256ZXJvID0gODU1MCkKCnBvc3Rfbm9uemVybyA8LSBwbG90X25vbnplcm8obHBfc2UsIHlfaW50ZXJjZXB0ID0gMC45OSkKcG9zdF9ub256ZXJvCgojIyBRdWljayB0ZXN0IHRvIHNlZSB0aGF0IEkgaGF2ZSBteSBTNCBkaXNwYXRjaCB3b3JraW5nIHByb3Blcmx5CnRlc3QgPC0gbm9ybWFsaXplKGxwX3NlKQpgYGAKCiMjIEV4dHJhY3QgaGlzdG9yaWNhbCBzdXNjZXB0aWJpbGl0eSBkYXRhCgpDb2x1bW4gJ1EnIGluIHRoZSBzYW1wbGUgc2hlZXQsIG1ha2UgYSBjYXRlZ29yaWNhbCB2ZXJzaW9uIG9mIGl0IHdpdGggdGhlc2UgcGFyYW1ldGVyczoKCiogMCA8PSB4IDw9IDM1IGlzIHJlc2lzdGFudAoqIDM2IDw9IHggPD0gNDggaXMgYW1iaWd1b3VzCiogNDkgPD0geCBpcyBzZW5zaXRpdmUKCk5vdGUgdGhhdCB0aGVzZSBjdXRvZmZzIGFyZSBvbmx5IHZhbGlkIGZvciB0aGUgaGlzdG9yaWNhbCBkYXRhLiAgVGhlCm5ld2VyIHN1c2NlcHRpYmlsaXR5IGRhdGEgdXNlcyBhIGN1dG9mZiBvZiAwLjc4IGZvciBzZW5zaXRpdmUuICBJIHdpbGwKc2V0IGFtYmlndW91cyB0byAwLjUgdG8gMC43OD8KCmBgYHtyfQptYXhfcmVzaXN0X2hpc3RvcmljYWwgPC0gMC4zNQptaW5fc2Vuc2l0aXZlX2hpc3RvcmljYWwgPC0gMC40OQojIyAyMDIzMDU6IFJlbW92ZWQgYW1iaWd1b3VzIGNhdGVnb3J5IGZvciB0aGUgY3VycmVudCBzZXQuCm1heF9yZXNpc3RfY3VycmVudCA8LSAwLjc3Cm1pbl9zZW5zaXRpdmVfY3VycmVudCA8LSAwLjc3CmBgYAoKVGhlIHNhbml0aXplX3BlcmNlbnQoKSBmdW5jdGlvbiBzZWVrcyB0byBtYWtlIHRoZSBwZXJjZW50YWdlIHZhbHVlcwpyZWNvcmRlZCBieSBleGNlbCBtb3JlIHJlbGlhYmxlLiAgVW5mb3J0dW5hdGVseSwgc29tZXRpbWVzIGV4Y2VsCmRpc3BsYXlzIHRoZSB2YWx1ZSAnNDklJyB3aGVuIHRoZSBpbmZvcm1hdGlvbiByZWNvcmRlZCBpbiB0aGUKd29ya3NoZWV0IGlzIGFueSBvbmUgb2YgdGhlIGZvbGxvd2luZzoKCiogJzQ5JQoqIDAuNDkKKiAiMC40OSIKClRodXMsIHRoZSBmb2xsb3dpbmcgYmxvY2sgd2lsbCBzYW5pdGl6ZSB0aGVzZSBwZXJjZW50YWdlIHZhbHVlcyBpbnRvIGEKc2luZ2xlIGRlY2ltYWwgbnVtYmVyIGFuZCBtYWtlIGEgY2F0ZWdvcmljYWwgdmFyaWFibGUgZnJvbSBpdCB1c2luZwpwcmUtZGVmaW5lZCB2YWx1ZXMgZm9yIHJlc2lzdGFudC9hbWJpZ3VvdXMvc2Vuc2l0aXZlLiAgVGhpcwpjYXRlZ29yaWNhbCB2YXJpYWJsZSB3aWxsIGJlIHN0b3JlZCBpbiBhIG5ldyBjb2x1bW46ICdzdXNfY2F0ZWdvcnlfaGlzdG9yaWNhbCcuCgpgYGB7cn0Kc3QgPC0gY29sRGF0YShscF9zZSlbWyJzdXNjZXB0aWJpbGl0eWluZmVjdGlvbnJlZHVjdGlvbjMydWdtbHNidmhpc3RvcmljYWxkYXRhIl1dCnN0YXJ0aW5nIDwtIHNhbml0aXplX3BlcmNlbnQoc3QpCnN0CnN0YXJ0aW5nCnN1c19jYXRlZ29yaWNhbCA8LSBzdGFydGluZwpuYV9pZHggPC0gaXMubmEoc3RhcnRpbmcpCnN1bShuYV9pZHgpCnN1c19jYXRlZ29yaWNhbFtuYV9pZHhdIDwtICJ1bmtub3duIgoKcmVzaXN0X2lkeCA8LSBzdGFydGluZyA8PSBtYXhfcmVzaXN0X2hpc3RvcmljYWwKc3VzX2NhdGVnb3JpY2FsW3Jlc2lzdF9pZHhdIDwtICJyZXNpc3RhbnQiCmluZGV0ZXJtaW5hbnRfaWR4IDwtIHN0YXJ0aW5nID4gbWF4X3Jlc2lzdF9oaXN0b3JpY2FsICYKICBzdGFydGluZyA8IG1pbl9zZW5zaXRpdmVfaGlzdG9yaWNhbApzdXNfY2F0ZWdvcmljYWxbaW5kZXRlcm1pbmFudF9pZHhdIDwtICJhbWJpZ3VvdXMiCnN1c2NlcHRpYmxlX2lkeCA8LSBzdGFydGluZyA+PSBtaW5fc2Vuc2l0aXZlX2hpc3RvcmljYWwKc3VzX2NhdGVnb3JpY2FsW3N1c2NlcHRpYmxlX2lkeF0gPC0gInNlbnNpdGl2ZSIKCnN1c19jYXRlZ29yaWNhbCA8LSBhcy5mYWN0b3Ioc3VzX2NhdGVnb3JpY2FsKQpjb2xEYXRhKGxwX3NlKVtbInN1c19jYXRlZ29yeV9oaXN0b3JpY2FsIl1dIDwtIHN1c19jYXRlZ29yaWNhbAp0YWJsZShzdXNfY2F0ZWdvcmljYWwpCgp0d29fc2Fua2V5IDwtIHBsb3RfbWV0YV9zYW5rZXkoCiAgbWVyZ2VkX3p5bW8sIGZhY3RvcnMgPSBjKCJ6eW1vZGVtZSIsICJjbGluaWNhbGNhdGVnb3JpY2FsIiwgInN1c2NlcHRpYmlsaXR5IiksCiAgZHJpbGxfZG93biA9IFRSVUUsIGNvbG9yX2Nob2ljZXMgPSBjb2xvcl9jaG9pY2VzKQp0d29fc2Fua2V5CmBgYAoKIyMgRXh0cmFjdCBjdXJyZW50IHN1c2NlcHRpYmlsaXR5IGRhdGEKClRoZSBzYW1lIHByb2Nlc3Mgd2lsbCBiZSByZXBlYXRlZCBmb3IgdGhlIGN1cnJlbnQgaXRlcmF0aW9uIG9mIHRoZQpzZW5zaXRpdml0eSBhc3NheSBhbmQgc3RvcmVkIGluIHRoZSAnc3VzX2NhdGVnb3J5X2N1cnJlbnQnIGNvbHVtbi4KCmBgYHtyfQpzdGFydGluZ19jdXJyZW50IDwtIHNhbml0aXplX3BlcmNlbnQoY29sRGF0YShscF9zZSlbWyJzdXNjZXB0aWJpbGl0eWluZmVjdGlvbnJlZHVjdGlvbjMydWdtbHNidmN1cnJlbnRkYXRhIl1dKQpzdXNfY2F0ZWdvcmljYWxfY3VycmVudCA8LSBzdGFydGluZ19jdXJyZW50Cm5hX2lkeCA8LSBpcy5uYShzdGFydGluZ19jdXJyZW50KQpzdW0obmFfaWR4KQpzdXNfY2F0ZWdvcmljYWxfY3VycmVudFtuYV9pZHhdIDwtICJ1bmtub3duIgoKIyMgVGhlIGZvbGxvd2luZyBpcyBvbmx5IHZhbGlkIHdoZW4gd2UgaGFkIHRocmVlIGNhdGVnb3JpZXMsIHJlc2lzdGFudC9hbWJpZ3VvdXMvc2Vuc2l0aXZlCiMjIFRoZSBuZXcgY3V0b2ZmcyBkcm9wIGFtYmlndW91cy4KI3Jlc2lzdF9pZHggPC0gc3RhcnRpbmdfY3VycmVudCA8PSBtYXhfcmVzaXN0X2N1cnJlbnQKI3N1c19jYXRlZ29yaWNhbF9jdXJyZW50W3Jlc2lzdF9pZHhdIDwtICJyZXNpc3RhbnQiCiNpbmRldGVybWluYW50X2lkeCA8LSBzdGFydGluZ19jdXJyZW50ID4gbWF4X3Jlc2lzdF9jdXJyZW50ICYKIyAgc3RhcnRpbmdfY3VycmVudCA8IG1pbl9zZW5zaXRpdmVfY3VycmVudAojc3VzX2NhdGVnb3JpY2FsX2N1cnJlbnRbaW5kZXRlcm1pbmFudF9pZHhdIDwtICJhbWJpZ3VvdXMiCiNzdXNjZXB0aWJsZV9pZHggPC0gc3RhcnRpbmdfY3VycmVudCA+PSBtaW5fc2Vuc2l0aXZlX2N1cnJlbnQKI3N1c19jYXRlZ29yaWNhbF9jdXJyZW50W3N1c2NlcHRpYmxlX2lkeF0gPC0gInNlbnNpdGl2ZSIKI3N1c19jYXRlZ29yaWNhbF9jdXJyZW50IDwtIGFzLmZhY3RvcihzdXNfY2F0ZWdvcmljYWxfY3VycmVudCkKcmVzaXN0X2lkeCA8LSBzdGFydGluZ19jdXJyZW50IDw9IG1heF9yZXNpc3RfY3VycmVudApzZW5zaXRpdmVfaWR4IDwtICFyZXNpc3RfaWR4CnN1c19jYXRlZ29yaWNhbF9jdXJyZW50W3Jlc2lzdF9pZHhdIDwtICJyZXNpc3RhbnQiCnN1c19jYXRlZ29yaWNhbF9jdXJyZW50W3NlbnNpdGl2ZV9pZHhdIDwtICJzZW5zaXRpdmUiCnN1c19jYXRlZ29yaWNhbF9jdXJyZW50IDwtIGFzLmZhY3RvcihzdXNfY2F0ZWdvcmljYWxfY3VycmVudCkKCmNvbERhdGEobHBfc2UpW1sic3VzX2NhdGVnb3J5X2N1cnJlbnQiXV0gPC0gc3VzX2NhdGVnb3JpY2FsX2N1cnJlbnQKY29sRGF0YShscF9zZSlbWyJzdXNjZXB0aWJpbGl0eSJdXSA8LSBzdXNfY2F0ZWdvcmljYWxfY3VycmVudAp0YWJsZShzdXNfY2F0ZWdvcmljYWxfY3VycmVudCkKCmxwX3NhbmtleSA8LSBwbG90X21ldGFfc2Fua2V5KAogIGxwX3NlLCBmYWN0b3JzID0gYygienltb2RlbWVjYXRlZ29yaWNhbCIsICJjbGluaWNhbGNhdGVnb3JpY2FsIiwgInN1c2NlcHRpYmlsaXR5IiksCiAgZHJpbGxfZG93biA9IFRSVUUsIGNvbG9yX2Nob2ljZXMgPSBjb2xvcl9jaG9pY2VzKQpscF9zYW5rZXkKYGBgCgpJbiBtYW55IHF1ZXJpZXMsIHdlIHdpbGwgc2VlayB0byBjb21wYXJlIG9ubHkgdGhlIHR3byBwcmltYXJ5IHN0cmFpbnMsCnp5bW9kZW1lIDIuMiBhbmQgMi4zLiAgVGhlIGZvbGxvd2luZyBibG9jayB3aWxsIGV4dHJhY3Qgb25seSB0aG9zZQpzYW1wbGVzLgoKTm90ZTogKklNUE9SVEFOVCogTWFyaWEgQWRlbGFpZGEgcHJlZmVycyBub3QgdG8gdXNlIGxwX3R3b19zdHJhaW5zLiAgV2Ugc2hvdWxkIG5vdCBhdCB0aGlzIHRpbWUKdXNlIHRoZSBtZXJnZWQgMi4xLzIuMiBhbmQgMi40LzIuMyBjYXRlZ29yaWVzLgoKYGBge3J9CmxwX3N0cmFpbiA8LSBscF9zZSAlPiUKICBzZXRfYmF0Y2hlcyhmYWN0ID0gc3VzX2NhdGVnb3JpY2FsX2N1cnJlbnQpICU+JQogIHNldF9jb2xvcnMoY29sb3JfY2hvaWNlc1tbInN0cmFpbiJdXSkKdGFibGUoY29sRGF0YShscF9zdHJhaW4pW1siY29uZGl0aW9uIl1dKQpzYXZlKGxpc3QgPSAibHBfc3RyYWluIiwgZmlsZSA9IGdsdWUoInJkYS90bXJjMl9scF9zdHJhaW4tdnt2ZXJ9LnJkYSIpKQpkYXRhX3N0cnVjdHVyZXMgPC0gYyhkYXRhX3N0cnVjdHVyZXMsICJscF9zdHJhaW4iKQoKbHBfdHdvX3N0cmFpbnMgPC0gbWVyZ2VkX3p5bW8Kc2F2ZShsaXN0ID0gImxwX3R3b19zdHJhaW5zIiwKICAgICBmaWxlID0gZ2x1ZSgicmRhL3RtcmMyX2xwX3R3b19zdHJhaW5zLXZ7dmVyfS5yZGEiKSkKZGF0YV9zdHJ1Y3R1cmVzIDwtIGMoZGF0YV9zdHJ1Y3R1cmVzLCAibHBfdHdvX3N0cmFpbnMiKQpgYGAKCiMjIENsaW5pY2FsIG91dGNvbWUKCkNsaW5pY2FsIG91dGNvbWUgaXMgYnkgZmFyIHRoZSBtb3N0IHByb2JsZW1hdGljIGNvbXBhcmlzb24gaW4gdGhpcwpkYXRhLCBidXQgaGVyZSBpcyB0aGUgcmVjYXRlZ29yaXphdGlvbiBvZiB0aGUgZGF0YSB1c2luZyBpdDoKCmBgYHtyfQpscF9jZiA8LSBzZXRfY29uZGl0aW9ucyhscF9zZSwgZmFjdCA9ICJjbGluaWNhbGNhdGVnb3JpY2FsIiwKICAgICAgICAgICAgICAgICAgICAgICAgICAgICBjb2xvcnMgPSBjb2xvcl9jaG9pY2VzW1siY2YiXV0pICU+JQogIHNldF9iYXRjaGVzKGZhY3QgPSBzdXNfY2F0ZWdvcmljYWxfY3VycmVudCkKdGFibGUoY29sRGF0YShscF9jZilbWyJjb25kaXRpb24iXV0pCmRhdGFfc3RydWN0dXJlcyA8LSBjKGRhdGFfc3RydWN0dXJlcywgImxwX2NmIikKc2F2ZShsaXN0ID0gImxwX2NmIiwgZmlsZSA9IGdsdWUoInJkYS90bXJjMl9scF9jZi12e3Zlcn0ucmRhIikpCgpscF9jZl9rbm93biA8LSBzdWJzZXRfc2UobHBfY2YsIHN1YnNldCA9ICJjb25kaXRpb24hPSd1bmtub3duJyIpCmRhdGFfc3RydWN0dXJlcyA8LSBjKGRhdGFfc3RydWN0dXJlcywgImxwX2NmX2tub3duIikKc2F2ZShsaXN0ID0gImxwX2NmX2tub3duIiwgZmlsZSA9IGdsdWUoInJkYS90bXJjMl9scF9jZl9rbm93bi12e3Zlcn0ucmRhIikpCmRhdGFfc3RydWN0dXJlcyA8LSBjKGRhdGFfc3RydWN0dXJlcywgImxwX2NmX2tub3duIikKc2F2ZShsaXN0ID0gImxwX2NmX2tub3duIiwgZmlsZSA9IGdsdWUoInJkYS90bXJjMl9scF9jZl9rbm93bi12e3Zlcn0ucmRhIikpCmBgYAoKIyMgQ3JlYXRlIGEgaGlzdG9yaWNhbCBzdXNjZXB0aWJpbGl0eSBkYXRhc2V0CgpVc2UgdGhlIGZhY3Rvcml6ZWQgdmVyc2lvbiBvZiBzdXNjZXB0aWJpbGl0eSB0byBjYXRlZ29yaXplIHRoZSBzYW1wbGVzCmJ5IHRoZSBoaXN0b3JpY2FsIGRhdGEuCgpgYGB7cn0KbHBfc3VzY2VwdGliaWxpdHlfaGlzdG9yaWNhbCA8LSBzZXRfY29uZGl0aW9ucygKICBscF9zZSwgZmFjdCA9ICJzdXNfY2F0ZWdvcnlfaGlzdG9yaWNhbCIsIGNvbG9ycyA9IGNvbG9yX2Nob2ljZXNbWyJzdXNjZXB0aWJpbGl0eSJdXSkgJT4lCiAgc2V0X2JhdGNoZXMoZmFjdCA9ICJjbGluaWNhbGNhdGVnb3JpY2FsIikKc2F2ZShsaXN0ID0gImxwX3N1c2NlcHRpYmlsaXR5X2hpc3RvcmljYWwiLAogICAgIGZpbGUgPSBnbHVlKCJyZGEvdG1yYzJfbHBfc3VzY2VwdGliaWxpdHlfaGlzdG9yaWNhbC12e3Zlcn0ucmRhIikpCmRhdGFfc3RydWN0dXJlcyA8LSBjKGRhdGFfc3RydWN0dXJlcywgImxwX3N1c2NlcHRpYmlsaXR5X2hpc3RvcmljYWwiKQpgYGAKCiMjIENyZWF0ZSBhIGN1cnJlbnQgc3VzY2VwdGliaWxpdHkgZGF0YXNldAoKVXNlIHRoZSBmYWN0b3JpemVkIHZlcnNpb24gb2Ygc3VzY2VwdGliaWxpdHkgdG8gY2F0ZWdvcml6ZSB0aGUgc2FtcGxlcwpieSB0aGUgaGlzdG9yaWNhbCBkYXRhLgoKVGhpcyB3aWxsIGxpa2VseSBiZSBvdXIgY2Fub25pY2FsIHN1c2NlcHRpYmlsaXR5IGRhdGFzZXQsIHNvIEkgd2lsbApyZW1vdmUgdGhlIHN1ZmZpeCBhbmQganVzdCBjYWxsIGl0ICdscF9zdXNjZXB0aWJpbGl0eScuCgpgYGB7cn0KbHBfc3VzY2VwdGliaWxpdHkgPC0gc2V0X2NvbmRpdGlvbnMoCiAgbHBfc2UsIGZhY3QgPSAic3VzX2NhdGVnb3J5X2N1cnJlbnQiLCBjb2xvcnMgPSBjb2xvcl9jaG9pY2VzW1sic3VzY2VwdGliaWxpdHkiXV0pICU+JQogIHNldF9iYXRjaGVzKGZhY3QgPSAiY2xpbmljYWxjYXRlZ29yaWNhbCIpCnNhdmUobGlzdCA9ICJscF9zdXNjZXB0aWJpbGl0eSIsCiAgICAgZmlsZSA9IGdsdWUoInJkYS90bXJjMl9scF9zdXNjZXB0aWJpbGl0eS12e3Zlcn0ucmRhIikpCmRhdGFfc3RydWN0dXJlcyA8LSBjKGRhdGFfc3RydWN0dXJlcywgImxwX3N1c2NlcHRpYmlsaXR5IikKYGBgCgojIyBQdWxsIG91dCBvbmx5IHRoZSBzYW1wbGVzIHdpdGggdHdvIHp5bW9kZW1lcwoKSSB0aGluayB0aGlzIGlzIHJlZHVuZGFudCB3aXRoIGEgcHJldmlvdXMgYmxvY2ssIGJ1dCBJIGFtIGxlYXZpbmcgaXQKdW50aWwgSSBhbSBjZXJ0YWluIHRoYXQgaXQgaXMgbm90IHJlcXVpcmVkIGluIGEgZm9sbG93aW5nIGRvY3VtZW50LgoKTm90ZTogKklNUE9SVEFOVCogVGhpcyBpcyB0aGUgc2V0IE1hcmlhIEFkZWxpYWRhIHByZWZlcnMgdG8gdXNlLgoKYGBge3J9CmxwX3p5bW8gPC0gc3Vic2V0X3NlKGxwX3NlLCBzdWJzZXQgPSAiY29uZGl0aW9uPT0nejIuMid8Y29uZGl0aW9uPT0nejIuMyciKQpkYXRhX3N0cnVjdHVyZXMgPC0gYyhkYXRhX3N0cnVjdHVyZXMsICJscF96eW1vIikKc2F2ZShsaXN0ID0gImxwX3p5bW8iLCBmaWxlID0gZ2x1ZSgicmRhL3RtcmMyX2xwX3p5bW8tdnt2ZXJ9LnJkYSIpKQpgYGAKCiMgVmFyaWFudCBkYXRhIHVzaW5nIHBhcmFzaXRlIFJOQVNlcSByZWFkcwoKVGhlIGZvbGxvd2luZyBzZWN0aW9uIHdpbGwgY3JlYXRlIHNvbWUgaW5pdGlhbCBkYXRhIHN0cnVjdHVyZXMgb2YgdGhlCm9ic2VydmVkIHZhcmlhbnRzIGluIHRoZSBwYXJhc2l0ZSBzYW1wbGVzLiAgVGhpcyB3aWxsIGluY2x1ZGUgc29tZSBvZgpvdXIgMjAxNiBzYW1wbGVzIGZvciBzb21lIGNsYXNzaWZpY2F0aW9uIHF1ZXJpZXMuCgojIyBUaGUgMjAxNiB2YXJpYW50IGRhdGEKCkkgY2hhbmdlZCBhbmQgaW1wcm92ZWQgdGhlIG1hcHBpbmcgYW5kIHZhcmlhbnQgZGV0ZWN0aW9uIG1ldGhvZHMgZnJvbQp3aGF0IHdlIHVzZWQgZm9yIHRoZSAyMDE2IGRhdGEuICBTbyBzb21lIHNtYWxsIGNoYW5nZXMgd2lsbCBiZQpyZXF1aXJlZCB0byBtZXJnZSB0aGVtLgoKYGBge3Igb2xkbmV3X3ZhcmlhbnRzLCBldmFsPUZBTFNFfQpscF9wcmV2aW91cyA8LSBjcmVhdGVfc2UoInNhbXBsZV9zaGVldHMvdG1yYzJfc2FtcGxlc18yMDE5MTIwMy54bHN4IiwKICAgICAgICAgICAgICAgICAgICAgICAgICAgZmlsZV9jb2x1bW4gPSAidG9waGF0MmZpbGUiLAogICAgICAgICAgICAgICAgICAgICAgICAgICBzYXZlZmlsZSA9IGdsdWUoInJkYS9scF9wcmV2aW91cy12e3Zlcn0ucmRhIikpCnR0IDwtIGxwX3ByZXZpb3VzJGV4cHJlc3Npb25zZXQKcm93bmFtZXModHQpIDwtIGdzdWIocGF0dGVybiA9ICJeZXhvbl8iLCByZXBsYWNlbWVudCA9ICIiLCB4ID0gcm93bmFtZXModHQpKQpyb3duYW1lcyh0dCkgPC0gZ3N1YihwYXR0ZXJuID0gIlxcLjEkIiwgcmVwbGFjZW1lbnQgPSAiIiwgeCA9IHJvd25hbWVzKHR0KSkKcm93bmFtZXModHQpIDwtIGdzdWIocGF0dGVybiA9ICJcXC0xJCIsIHJlcGxhY2VtZW50ID0gIiIsIHggPSByb3duYW1lcyh0dCkpCmxwX3ByZXZpb3VzJGV4cHJlc3Npb25zZXQgPC0gdHQKcm0odHQpCmRhdGFfc3RydWN0dXJlcyA8LSBjKGRhdGFfc3RydWN0dXJlcywgImxwX3ByZXZpb3VzIikKYGBgCgojIyBDcmVhdGUgdGhlIFNOUCBleHByZXNzaW9uc2V0CgpUaGUgY291bnRfc2Vfc25wcygpIGZ1bmN0aW9uIHVzZXMgb3VyIGV4cHJlc3Npb25zZXQgZGF0YSBhbmQgYQptZXRhZGF0YSBjb2x1bW4gaW4gb3JkZXIgdG8gZXh0cmFjdCB0aGUgbXBpbGV1cCBvciBmcmVlYmF5ZXMtYmFzZWQKdmFyaWFudCBjYWxscyBhbmQgY3JlYXRlIG1hdHJpY2VzIG9mIHRoZSBsaWtlbGlob29kIHRoYXQgZWFjaApwb3NpdGlvbi1wZXItc2FtcGxlIGlzIGluIGZhY3QgYSB2YXJpYW50LgoKVGhlcmUgaXMgYW4gaW1wb3J0YW50IGNhdmVhdCBoZXJlIHdoaWNoIGNoYW5nZWQgb24gMjAyMzAxOiAgSSB3YXMKaW50ZXJwcmV0aW5nIHVzaW5nIHRoZSBQQUlSRUQgdGFnLCB3aGljaCBpcyBvbmx5IHVzZWQgZm9yLAp1bnN1cnByaXNpbmdseSwgcGFpcmVkLWVuZCBzYW1wbGVzLiAgQSBjb3VwbGUgc2FtcGxlcyBhcmUgbm90IHBhaXJlZAphbmQgc28gd2VyZSBmYWlsaW5nIHNpbGVudGx5LiAgVGhlIFFBIHRhZyBsb29rcyBsaWtlIGl0IGlzIG1vcmUKYXBwcm9wcmlhdGUgYW5kIHNob3VsZCB3b3JrIGFjcm9zcyBib3RoIHR5cGVzLiAgT25lIHdheSB0byBmaW5kIG91dCwgSQphbSBzZXR0aW5nIGl0IGhlcmUgYW5kIHdpbGwgbG9vayB0byBzZWUgaWYgdGhlIHJlc3VsdHMgbWFrZSBtb3JlIHNlbnNlCmZvciBteSB0ZXN0IHNhbXBsZXMgKFRNUkMyMDAxLCBUTVJDMjAwNSwgVE1SQzIwMDcpLgoKYGBge3J9CiMjIFRoZSBuZXh0IGxpbmUgZHJvcHMgdGhlIHNhbXBsZXMgd2hpY2ggYXJlIG1pc3NpbmcgdGhlIFNOUCBwaXBlbGluZS4KbHBfc25wIDwtIHN1YnNldF9zZShscF9zZSwgc3Vic2V0ID0gIiFpcy5uYShjb2xEYXRhKGxwX3NlKVtbJ2ZyZWViYXllc3N1bW1hcnknXV0pIikKCmxwX3NucF9zdWZmaWNpZW50IDwtIHN1YnNldF9zZShscF9zbnAsIHN1YnNldCA9ICJyb3duYW1lcyE9J1RNUkMyMDA4MiciKQpscF9zbnBfb25seTIyXzIzX3JlZiA8LSBzdWJzZXRfc2UobHBfc25wLCBzdWJzZXQgPSAienltb2RlbWVyZWZlcmVuY2U9PSd6Mi4yJ3x6eW1vZGVtZXJlZmVyZW5jZT09J3oyLjMnIikgJT4lCiAgc3Vic2V0X3NlKHN1YnNldCA9ICJyb3duYW1lcyE9J1RNUkMyMDA4MiciKQpscF9zbnBfMjJfMjNfbWwgPC0gc3Vic2V0X3NlKGxwX3NucCwgc3Vic2V0ID0gImtubnYyY2xhc3NpZmljYXRpb249PSd6MjInfGtubnYyY2xhc3NpZmljYXRpb249PSd6MjMnIikgJT4lCiAgc3Vic2V0X3NlKHN1YnNldCA9ICJyb3duYW1lcyE9J1RNUkMyMDA4MiciKQoKbmV3X3NucHNfc3VmZmljaWVudCA8LSBjb3VudF9zbnBzKGxwX3NucF9zdWZmaWNpZW50LCBhbm5vdF9jb2x1bW4gPSAiZnJlZWJheWVzc3VtbWFyeSIsCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICBzbnBfY29sdW1uID0gIlFBIiwgcmVhZGVyID0gInJlYWRyIikKbmV3X3NucHNfb25seTIyXzIzX3JlZl9zdWYgPC0gY291bnRfc25wcyhscF9zbnBfb25seTIyXzIzX3JlZiwgYW5ub3RfY29sdW1uID0gImZyZWViYXllc3N1bW1hcnkiLAogICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgIHNucF9jb2x1bW4gPSAiUUEiLCByZWFkZXIgPSAicmVhZHIiKQpuZXdfc25wc18yMl8yM19tbF9zdWYgPC0gY291bnRfc25wcyhscF9zbnBfMjJfMjNfbWwsIGFubm90X2NvbHVtbiA9ICJmcmVlYmF5ZXNzdW1tYXJ5IiwKICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgc25wX2NvbHVtbiA9ICJRQSIsIHJlYWRlciA9ICJyZWFkciIpCgojIyBMZXRzIHNlZSBpZiB3ZSBnZXQgbnVtYmVycyB3aGljaCBtYWtlIHNlbnNlLgpzdW1tYXJ5KGFzc2F5KG5ld19zbnBzX3N1ZmZpY2llbnQpW1siVE1SQzIwMDAxIl1dKSAgIyMgTXkgd2VpcmRvIHNhbXBsZQpzdW1tYXJ5KGFzc2F5KG5ld19zbnBzX3N1ZmZpY2llbnQpW1siVE1SQzIwMDcyIl1dKSAgIyMgQW5vdGhlciBzYW1wbGUgY2hvc2VuIGF0IHJhbmRvbQpzdW1tYXJ5KGFzc2F5KG5ld19zbnBzX3N1ZmZpY2llbnQpW1siVE1SQzIwMDIxIl1dKSAgIyMgQW5vdGhlciBzYW1wbGUgY2hvc2VuIGF0IHJhbmRvbQojIyBOb3cgdGhhdCB3ZSBhcmUgcmVhc29uYWJseSBjb25maWRlbnQgdGhhdCB0aGluZ3MgbWFrZSBtb3JlIHNlbnNlLCBsZXRzIHNhdmUgYW5kIG1vdmUgb24uLi4KZGF0YV9zdHJ1Y3R1cmVzIDwtIGMoZGF0YV9zdHJ1Y3R1cmVzLCAibmV3X3NucHNfc3VmZmljaWVudCIsICJscF9zbnAiKQoKIyMgTW9zdCBvZiB0aGUgdGltZSBJIGp1c3QgcnVuIG5vcm1hbGl6ZSgpIGFuZCBhc3N1bWUgaXQgd2lsbCBkaXNwYXRjaCB0byBub3JtYWxpemVfc2UoKQpzdWZmaWNpZW50X25vcm0gPC0gbm9ybWFsaXplKG5ld19zbnBzX3N1ZmZpY2llbnQsIHRyYW5zZm9ybSA9ICJsb2cyIikKcGxvdF9ib3hwbG90KHN1ZmZpY2llbnRfbm9ybSkKYGBgCgpOb3cgbGV0IHVzIHB1bGwgaW4gdGhlIDIwMTYgZGF0YS4KCmBgYHtyIG1lcmdlX25ld19vbGQsIGV2YWw9RkFMU0V9Cm9sZF9zbnBzIDwtIGNvdW50X3NucHMobHBfcHJldmlvdXMsIGFubm90X2NvbHVtbiA9ICJiY2Z0YWJsZSIsIHNucF9jb2x1bW4gPSAyKQpkYXRhX3N0cnVjdHVyZXMgPC0gYyhkYXRhX3N0cnVjdHVyZXMsICJvbGRfc25wcyIpCgpzYXZlKGxpc3QgPSAibHBfc25wIiwgZmlsZSA9IGdsdWUoInJkYS9scF9zbnAtdnt2ZXJ9LnJkYSIpKQpkYXRhX3N0cnVjdHVyZXMgPC0gYyhkYXRhX3N0cnVjdHVyZXMsICJscF9zbnAiKQpzYXZlKGxpc3QgPSAibmV3X3NucHMiLCBmaWxlID0gZ2x1ZSgicmRhL25ld19zbnBzLXZ7dmVyfS5yZGEiKSkKZGF0YV9zdHJ1Y3R1cmVzIDwtIGMoZGF0YV9zdHJ1Y3R1cmVzLCAibmV3X3NucHMiKQpzYXZlKGxpc3QgPSAib2xkX3NucHMiLCBmaWxlID0gZ2x1ZSgicmRhL29sZF9zbnBzLXZ7dmVyfS5yZGEiKSkKZGF0YV9zdHJ1Y3R1cmVzIDwtIGMoZGF0YV9zdHJ1Y3R1cmVzLCAib2xkX3NucHMiKQoKbm9uemVyb19zbnBzIDwtIGFzc2F5KG5ld19zbnBzKSAhPSAwCmNvbFN1bXMobm9uemVyb19zbnBzKQpgYGAKCiMjIENvbWJpbmUgdGhlIHByZXZpb3VzIGFuZCBjdXJyZW50IGRhdGEKCkFzIGZhciBhcyBJIGNhbiB0ZWxsLCBmcmVlYmF5ZXMgYW5kIG1waWxldXAgYXJlIHJlYXNvbmFibHkgc2ltaWxhciBpbgp0aGVpciBzZW5zaXRpdml0eS9zcGVjaWZpY2l0eTsgc28gY29tYmluaW5nIHRoZSB0d28gZGF0YXNldHMgbGlrZSB0aGlzCmlzIGV4cGVjdGVkIHRvIHdvcmsgd2l0aCBtaW5pbWFsIHByb2JsZW1zLiAgVGhlIG1vc3QgbGlrZWx5IHByb2JsZW0gaXMKdGhhdCBteSBtcGlsZXVwLWJhc2VkIHBpcGVsaW5lIGlzIHVuYWJsZSB0byBoYW5kbGUgaW5kZWxzLgoKYGBge3IgY29tYmluZV9vbGRfc25wcywgZXZhbD1GQUxTRX0KIyMgTXkgb2xkX3NucHMgaXMgdXNpbmcgYW4gb2xkZXIgYW5ub3RhdGlvbiBpbmNvcnJlY3RseSwgc28gZml4IGl0IGhlcmU6CiNhbm5vdGF0aW9uKG9sZF9zbnBzKSA8LSBhbm5vdGF0aW9uKG5ld19zbnBzKQpib3RoX3NucHMgPC0gY29tYmluZV9zZXMobmV3X3NucHMsIG9sZF9zbnBzKQpzYXZlKGxpc3QgPSAiYm90aF9zbnBzIiwKICAgICBmaWxlID0gZ2x1ZSgicmRhL2JvdGhfc25wcy12e3Zlcn0ucmRhIikpCmRhdGFfc3RydWN0dXJlcyA8LSBjKGRhdGFfc3RydWN0dXJlcywgImJvdGhfc25wcyIpCmBgYAoKIyBTdWJjbGFkZSBtYW51YWwgaW50ZXJwcmV0YXRpb24KCkkgYW0gdGFraW5nIGEgaGVhdG1hcCBmcm9tIG91ciB2YXJpYW50IGRhdGEgYW5kIG1hbnVhbGx5IGlkZW50aWZ5aW5nIHNhbXBsZSBncm91cHMuCgoqIEE6IFRNUkMyMDAyNSwgVE1SQzIwMDI3LCBUTVJDMjAwMjgKKiBCOiBocGdsMDY0MSwgaHBnbDAyNDcsIGhwZ2wwNjMxLCBocGdsMDY1OCwgY2xvc2UgdG8gQQoqIEM6IFRNUkMyMDAwOCwgVE1SQzIwMDA3LCBUTVJDMjAwMDEsIFRNUkMyMDAwNSwgaHBnbDAzMTgsIFRNUkMyMDAxMgoqIEQ6IGhwZ2wwNjQzLCBocGdsMDMxNiwgaHBnbDAzMjAsIGhwZ2wwNjQxLCBjbG9zZSB0byBDCiogRTogVE1SQzIwMDMyLCBUTVJDMjAwNjEKKiBGOiBUTVJDMjAwNDAsIFRNUkMyMDAzNiwgaHBnbDAyNDUsIFRNUkMyMDEwMywgVE1SQzIwMDkzLCBUTVJDMjAwNDUsCiAgICAgVE1SQzIwMDQxLCBUTVJDMjAwNzIsIFRNUkMyMDA0NiwgVE1SQzIwMDU3LCBUTVJDMjAwOTcsIFRNUkMyMDA4NCwKICAgICBjbG9zZSB0byBFCiogRzogaHBnbDA2MzIsIGhwZ2wwNjUyLCBocGdsMDI0OCwgaHBnbDA2NTkKKiBIOiBocGdsMDY1NCwgaHBnbDA2MzQsIGhwZ2wwMjQzLCBocGdsMDI0MywgY2xvc2VzdCB0byBHCiogSTogaHBnbDAyNDIsIGhwZ2wwMzIyLCBocGdsMDYzNiwgaHBnbDA2NjMsIGhwZ2wwNjM4LCBjbG9zZSB0byBICiogSjogVE1SQzIwMDE3LCBUTVJDMjAwMzMsIFRNUkMyMDA1MywgVE1SQzIwMDYzLCBUTVJDMjAwNTYsIFRNUkMyMDA3NCwKICAgICBUTVJDMjAwNTUsIFRNUkMyMDAyMiwgVE1SQzIwMDI2LCBUTVJDMjAwODMsIFRNUkMyMDA3NywgVE1SQzIwMDYwCiogSzogVE1SQzIwMDUwLCBUTVJDMjAwNDIsIFRNUkMyMDA3OCwgVE1SQzIwMDQ5LCBUTVJDMjAwNjksIFRNUkMyMDA0NCwKICAgICBjbG9zZSB0byBKCiogTDogVE1SQzIwMDc2LCBUTVJDMjAwMjQsIFRNUkMyMDA5CiogTTogVE1SQzIwMDE5LCBUTVJDMjAwMjAsIFRNUkMyMDAzMSwgVE1SQzIwMDE0LCBUTVJDMjAwMTEsIGNsb3NlIHRvIEwKKiBOOiBUTVJDMjAwOTYsIFRNUkMyMDA4MSwgVE1SQzIwMTEwLCBUTVJDMjAwOTIsIFRNUkMyMDA4OCwgVE1SQzIwMTAxLAogICAgIFRNUkMyMDEwNiwgVE1SQzIwMDkxLCBUTVJDMjAxMDksIFRNUkMyMDA4NywgVE1SQzIwMDg2LCBjbG9zZWlzaAogICAgIHRvIE0KKiBPOiBUTVJDMjAwOTUsIFRNUkMyMDAxNiwgVE1SQzIwMDE4LCBxdWl0ZSBmYXIgZnJvbSBldmVyeW9uZQoqIFA6IFRNUkMyMDA4MiwgVE1SQzIwMDc1LCBwcmV0dHkgc2VwYXJhdGUgdG9vCiogUTogaHBnbDAyNDYsIGhwZ2wwNjUzLCBocGdsMDYzMywgaHBnbDAyNDQsIGhwZ2wwNjM1LCBocGdsMDY1NSwKICAgICBocGdsMDYzOSwgaHBnbDA2NjIKKiBSOiBUTVJDMjAwNTksIFRNUkMyMDA4OSwgVE1SQzIwMDIxLCBUTVJDMjAwNDgsIFRNUkMyMDA2NwoqIFM6IFRNUkMyMDAxMywgVE1SQzIwMDEwLCBUTVJDMjAwMzcsIFRNUkMyMDA2NiwgVE1SQzIwMDYyLCBUTVJDMjAwMzgsCiAgICAgY2xvc2UgdG8gUgoqIFQ6IFRNUkMyMDAxNSwgVE1SQzIwMTA4LCBUTVJDMjAwOTksIFRNUkMyMDEwMiwgVE1SQzIwMDg1LCBUTVJDMjAwOTAsCiAgICAgVE1SQzIwMTA0LCBUTVJDMjAwOTgsIFRNUkMyMDEwMCwgVE1SQzIwMTA3CiogVTogVE1SQzIwMDQ3LCBUTVJDMjAwNjgsIFRNUkMyMDA4MCwgVE1SQzIwMTA1LCBUTVJDMjAwOTQsIFRNUkMyMDA2NSwKICAgICBUTVJDMjAwNzEsIFRNUkMyMDA2NCwgVE1SQzIwMDQzLCBUTVJDMjAwNzAsIFRNUkMyMDA2MiwgVE1SQzIwMDUxLAogICAgIFRNUkMyMDA3OSwgVE1SQzIwMDczLCBUTVJDMjAwNTgsIFRNUkMyMDA1NAoKIyBNYWNyb3BoYWdlIGRhdGEKCkFsbCBvZiB0aGUgYWJvdmUgZm9jdXNlZCBlbnRpcmUgb24gdGhlIHBhcmFzaXRlIHNhbXBsZXMsIG5vdyBsZXQgdXMKcHVsbCB1cCB0aGUgbWFjcm9waGFnZSBpbmZlY3RlZCBzYW1wbGVzLiAgVGhpcyB3aWxsIGNvbXByaXNlIHR3bwpkYXRhc2V0cywgb25lIG9mIHRoZSBodW1hbiBhbmQgb25lIG9mIHRoZSBwYXJhc2l0ZS4KCiMjIE1hY3JvcGhhZ2UgaG9zdCBkYXRhCgpUaGUgbWV0YWRhdGEgZm9yIHRoZSBtYWNyb3BoYWdlIHNhbXBsZXMgY29udGFpbnMgYSBjb3VwbGUgb2YgY29sdW1ucwpmb3IgbWFwcGVkIGh1bWFuIGFuZCBwYXJhc2l0ZSByZWFkcy4gIFdlIHdpbGwgdGhlcmVmb3JlIHVzZSB0aGVtCnNlcGFyYXRlbHkgdG8gY3JlYXRlIHR3byBleHByZXNzaW9uc2V0cywgb25lIGZvciBlYWNoIHNwZWNpZXMuCgpgYGB7cn0KaHNfYW5ub3QgPC0gbG9hZF9iaW9tYXJ0X2Fubm90YXRpb25zKHllYXIgPSAiMjAyMCIsIG1vbnRoID0gNCkKaHNfYW5ub3QgPC0gaHNfYW5ub3RbWyJhbm5vdGF0aW9uIl1dCmhzX2Fubm90W1sidHJhbnNjcmlwdCJdXSA8LSBwYXN0ZTAocm93bmFtZXMoaHNfYW5ub3QpLCAiLiIsIGhzX2Fubm90W1sidHJhbnNjcmlwdF92ZXJzaW9uIl1dKQpyb3duYW1lcyhoc19hbm5vdCkgPC0gbWFrZS5uYW1lcyhoc19hbm5vdFtbImVuc2VtYmxfZ2VuZV9pZCJdXSwgdW5pcXVlID0gVFJVRSkKcm93bmFtZXMoaHNfYW5ub3QpIDwtIHBhc3RlMCgiZ2VuZToiLCByb3duYW1lcyhoc19hbm5vdCkpCnR4X2dlbmVfbWFwIDwtIGhzX2Fubm90WywgYygidHJhbnNjcmlwdCIsICJlbnNlbWJsX2dlbmVfaWQiKV0KCnNhbml0aXplX2NvbHVtbnMgPC0gYygiZHJ1ZyIsICJtYWNyb3BoYWdldHJlYXRtZW50IiwgIm1hY3JvcGhhZ2V6eW1vZGVtZSIpCm1hY3JfYW5ub3QgPC0gaHNfYW5ub3QKcm93bmFtZXMobWFjcl9hbm5vdCkgPC0gZ3N1Yih4ID0gcm93bmFtZXMobWFjcl9hbm5vdCksCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgcGF0dGVybiA9ICJeZ2VuZToiLAogICAgICAgICAgICAgICAgICAgICAgICAgICAgIHJlcGxhY2VtZW50ID0gIiIpCmhzX21hY3JvcGhhZ2UgPC0gY3JlYXRlX3NlKG1hY3JvcGhhZ2Vfc2hlZXQsIGdlbmVfaW5mbyA9IG1hY3JfYW5ub3QsCiAgICAgICAgICAgICAgICAgICAgICAgICAgIGZpbGVfY29sdW1uID0gImhnMzgxMDBoaXNhdGZpbGUiKSAlPiUKICBzZXRfY29uZGl0aW9ucyhmYWN0ID0gIm1hY3JvcGhhZ2V0cmVhdG1lbnQiKSAlPiUKICBzZXRfYmF0Y2hlcyhmYWN0ID0gIm1hY3JvcGhhZ2V6eW1vZGVtZSIpICU+JQogIHNhbml0aXplX21ldGFkYXRhKGNvbHVtbnMgPSBzYW5pdGl6ZV9jb2x1bW5zKSAlPiUKICBzdWJzZXRfc2Uobm9uemVybyA9IDEyMDAwKQpmaXhlZF9nZW5lbmFtZXMgPC0gZ3N1Yih4ID0gcm93bmFtZXMoYXNzYXkoaHNfbWFjcm9waGFnZSkpLCBwYXR0ZXJuID0gIl5nZW5lOiIsCiAgICAgICAgICAgICAgICAgICAgICAgIHJlcGxhY2VtZW50ID0gIiIpCmhzX21hY3JvcGhhZ2UgPC0gc2V0X2dlbmVuYW1lcyhoc19tYWNyb3BoYWdlLCBpZHMgPSBmaXhlZF9nZW5lbmFtZXMpCnRhYmxlKGNvbERhdGEoaHNfbWFjcm9waGFnZSkkY29uZGl0aW9uKQoKIyMgVGhlIGZvbGxvd2luZyAzIGxpbmVzIHdlcmUgY29weS9wYXN0ZWQgdG8gZGF0YXN0cnVjdHVyZXMgYW5kIHNob3VsZCBiZSByZW1vdmVkIHNvb24uCm5vc3RyYWluIDwtIGlzLm5hKGNvbERhdGEoaHNfbWFjcm9waGFnZSlbWyJzdHJhaW5pZCJdXSkKY29sRGF0YShoc19tYWNyb3BoYWdlKVtub3N0cmFpbiwgInN0cmFpbmlkIl0gPC0gIm5vbmUiCgpjb2xEYXRhKGhzX21hY3JvcGhhZ2UpW1sic3RyYWluX3p5bW8iXV0gPC0gcGFzdGUwKCJzIiwgY29sRGF0YShoc19tYWNyb3BoYWdlKVtbInN0cmFpbmlkIl1dLAogICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAiXyIsIGNvbERhdGEoaHNfbWFjcm9waGFnZSlbWyJtYWNyb3BoYWdlenltb2RlbWUiXV0pCnVuaW5mZWN0ZWQgPC0gY29sRGF0YShoc19tYWNyb3BoYWdlKVtbInN0cmFpbl96eW1vIl1dID09ICJzbm9uZV9ub25lIgpjb2xEYXRhKGhzX21hY3JvcGhhZ2UpW3VuaW5mZWN0ZWQsICJzdHJhaW5fenltbyJdIDwtICJ1bmluZmVjdGVkIgoKZGF0YV9zdHJ1Y3R1cmVzIDwtIGMoZGF0YV9zdHJ1Y3R1cmVzLCAiaHNfbWFjcm9waGFnZSIpCmBgYAoKRmluYWxseSwgc3BsaXQgb2ZmIHRoZSBVOTM3IHNhbXBsZXMuCgpgYGB7cn0KaHNfdTkzNyA8LSBzdWJzZXRfc2UoaHNfbWFjcm9waGFnZSwgc3Vic2V0ID0gInR5cGVvZmNlbGxzIT0nTWFjcm9waGFnZXMnIikKZGF0YV9zdHJ1Y3R1cmVzIDwtIGMoZGF0YV9zdHJ1Y3R1cmVzLCAiaHNfdTkzNyIpCmBgYAoKIyMgTWFjcm9waGFnZSBwYXJhc2l0ZSBkYXRhCgpJbiB0aGUgcHJldmlvdXMgYmxvY2ssIHdlIHVzZWQgYSBuZXcgaW52b2NhdGlvbiBvZiBlbnNlbWJsLWRlcml2ZWQKYW5ub3RhdGlvbiBkYXRhLCB0aGlzIHRpbWUgd2UgY2FuIGp1c3QgdXNlIG91ciBleGlzdGluZyBwYXJhc2l0ZSBnZW5lCmFubm90YXRpb25zLgoKYGBge3J9CmxwX21hY3JvcGhhZ2UgPC0gY3JlYXRlX3NlKG1hY3JvcGhhZ2Vfc2hlZXQsIGZpbGVfY29sdW1uID0gImxwYW5hbWVuc2lzdjM2aGlzYXRmaWxlIiwKICAgICAgICAgICAgICAgICAgICAgICAgICAgZ2VuZV9pbmZvID0gYWxsX2xwX2Fubm90LAogICAgICAgICAgICAgICAgICAgICAgICAgICBzYXZlZmlsZSA9IGdsdWUoInJkYS9scF9tYWNyb3BoYWdlLXZ7dmVyfS5yZGEiKSwKICAgICAgICAgICAgICAgICAgICAgICAgICAgYW5ub3RhdGlvbiA9ICJvcmcuTHBhbmFtZW5zaXMuTUhPTUNPTDgxTDEzLnY0Ni5lZy5kYiIpICU+JQogIHNldF9jb25kaXRpb25zKGZhY3QgPSAibWFjcm9waGFnZXp5bW9kZW1lIikgJT4lCiAgc2V0X2JhdGNoZXMoZmFjdCA9ICJtYWNyb3BoYWdldHJlYXRtZW50IikKCnVuZmlsdF93cml0dGVuIDwtIHdyaXRlX3NlKAogIGxwX21hY3JvcGhhZ2UsCiAgZXhjZWwgPSBnbHVlKCJhbmFseXNlcy9tYWNyb3BoYWdlX2RlL3t2ZXJ9L3JlYWRfY291bnRzL2xwX21hY3JvcGhhZ2VfcmVhZHNfdW5maWx0ZXJlZC12e3Zlcn0ueGxzeCIpKQoKbHBfbWFjcm9waGFnZV9maWx0IDwtIHN1YnNldF9zZShscF9tYWNyb3BoYWdlLCBub256ZXJvID0gMjUwMCkKIyMgIHNlbWFudGljX2ZpbHRlcihzZW1hbnRpYyA9IGMoImFtYXN0aW4iLCAiZ3A2MyIsICJsZWlzaG1hbm9seXNpbiIpLAojIyAgICAgICAgICAgICAgICAgIHNlbWFudGljX2NvbHVtbiA9ICJhbm5vdF9nZW5lX3Byb2R1Y3QiKQpkYXRhX3N0cnVjdHVyZXMgPC0gYyhkYXRhX3N0cnVjdHVyZXMsICJscF9tYWNyb3BoYWdlIiwgImxwX21hY3JvcGhhZ2VfZmlsdCIpCmZpbHRfd3JpdHRlbiA8LSB3cml0ZV9zZShscF9tYWNyb3BoYWdlX2ZpbHQsCiAgZXhjZWwgPSBnbHVlKCJhbmFseXNlcy9tYWNyb3BoYWdlX2RlL3t2ZXJ9L3JlYWRfY291bnRzL2xwX21hY3JvcGhhZ2VfcmVhZHNfZmlsdGVyZWQtdnt2ZXJ9Lnhsc3giKSkKbHBfbWFjcm9waGFnZSA8LSBscF9tYWNyb3BoYWdlX2ZpbHQKCmxwX21hY3JvcGhhZ2Vfbm9zYiA8LSBzdWJzZXRfc2UobHBfbWFjcm9waGFnZSwgc3Vic2V0ID0gImJhdGNoIT0naW5mX3NiJyIpCmxwX25vc2Jfd3JpdGUgPC0gd3JpdGVfc2UoCiAgbHBfbWFjcm9waGFnZV9ub3NiLAogIGV4Y2VsID0gZ2x1ZSgiYW5hbHlzZXMvbWFjcm9waGFnZV9kZS97dmVyfS9yZWFkX2NvdW50cy9scF9tYWNyb3BoYWdlX25vc2JfcmVhZHMtdnt2ZXJ9Lnhsc3giKSkKZGF0YV9zdHJ1Y3R1cmVzIDwtIGMoZGF0YV9zdHJ1Y3R1cmVzLCAibHBfbWFjcm9waGFnZV9ub3NiIikKCnNwZWMgPC0gbWFrZV9ybmFzZXFfc3BlYygpCnRlc3QgPC0gc20oZ2F0aGVyX3ByZXByb2Nlc3NpbmdfbWV0YWRhdGEobWFjcm9waGFnZV9zaGVldCwgc3BlY2lmaWNhdGlvbiA9IHNwZWMpKQpgYGAKCiMgUGxvdCBTTCBSZWFkcyBvbiBhIHBlciBjb25kaXRpb24gYmFzaXMKCmBgYHtyfQpscF9tZXRhIDwtIGNvbERhdGEobHBfbWFjcm9waGFnZSkKbHBfbWV0YVtbInNsdnNyZWFkc19sb2ciXV0gPC0gbG9nMTAobHBfbWV0YVtbInNsdnNyZWFkcyJdXSkKaW5mX3ZhbHVlcyA8LSBpcy5pbmZpbml0ZShscF9tZXRhW1sic2x2c3JlYWRzX2xvZyJdXSkKbHBfbWV0YVtpbmZfdmFsdWVzLCAic2x2c3JlYWRzX2xvZyJdIDwtIC0xMAoKY29sb3JfdmVjdG9yIDwtIGFzLmNoYXJhY3Rlcihjb2xvcl9jaG9pY2VzW1sic3RyYWluIl1dKQpuYW1lcyhjb2xvcl92ZWN0b3IpIDwtIG5hbWVzKGNvbG9yX2Nob2ljZXNbWyJzdHJhaW4iXV0pCmNvbG9yX3ZlY3RvciA8LSBjb2xvcl92ZWN0b3JbYygiejIuMiIsICJ6Mi4zIiwgInVua25vd24iKV0KbmFtZXMoY29sb3JfdmVjdG9yKSA8LSBjKCJ6Mi4yIiwgInoyLjMiLCAibm9uZSIpCnNsX3Zpb2xpbiA8LSBnZ3Bsb3QobHBfbWV0YSwKICAgICAgICAgICAgICAgICAgICBhZXMoeCA9IC5kYXRhW1siY29uZGl0aW9uIl1dLCB5ID0gLmRhdGFbWyJzbHZzcmVhZHNfbG9nIl1dLAogICAgICAgICAgICAgICAgICAgICAgICBmaWxsID0gLmRhdGFbWyJjb25kaXRpb24iXV0pKSArCiAgZ2VvbV92aW9saW4oKSArCiAgZ2VvbV9wb2ludCgpICsKICBzY2FsZV9maWxsX21hbnVhbCh2YWx1ZXMgPSBjb2xvcl92ZWN0b3IpCnNsX3Zpb2xpbgoKZ2dzdGF0c3Bsb3Q6OmdnYmV0d2VlbnN0YXRzKGFzLmRhdGEuZnJhbWUobHBfbWV0YSksIHggPSAiY29uZGl0aW9uIiwgeSA9ICJzbHZzcmVhZHNfbG9nIikKYGBgCgojIE1ha2UgYSBzaWxseSBwbG9pZHkgcGxvdAoKSSB3YW50IHRvIG1ha2UgYW4gZXN0aW1hdGUgb2YgcGxvaWR5IHVzaW5nIHRyYW5zY3JpcHRvbWljIGRhdGEuICBUaGlzCmlzIGJ5IGRlZmluaXRpb24gYSBmb29sZCdzIGVycmFuZCwgYnV0IEkgdGhpbmsgaXQgbWlnaHQgd29yay4KCmBgYHtyfQpscF9ycGttIDwtIG5vcm1hbGl6ZShscF9zZSwgY29udmVydCA9ICJycGttIiwgZmlsdGVyID0gVFJVRSwKICAgICAgICAgICAgICAgICAgICAgbGVuZ3RoX2NvbHVtbiA9ICJhbm5vdF9jZHNfbGVuZ3RoIiwgbmFfdG9femVybyA9IFRSVUUpCgojIyBFeGNsdWRlIHNjYWZmb2xkcwp1bndhbnRlZCA8LSBncmVwbChwYXR0ZXJuID0gIlNDQUYiLCB4ID0gcm93RGF0YShscF9ycGttKVtbImFubm90X2dlbmVfbG9jYXRpb25fdGV4dCJdXSkKIyMgSSB0aGluayBteSBzdWJzZXQgbG9naWMgaXMgYmFjd2FyZHMuLi4KbHBfd2FudGVkIDwtIGxwX3Jwa21bIXVud2FudGVkLCBdCgpzdW1tYXJ5X2RmIDwtIGFzLmRhdGEuZnJhbWUoYXNzYXkobHBfd2FudGVkKSkKc3VtbWFyeV9kZltbImdlbmVfbWVhbiJdXSA8LSByb3dNZWFucyhzdW1tYXJ5X2RmLCBuYS5ybSA9IFRSVUUpCnN1bW1hcnlfZGZbWyJjaHJvbW9zb21lIl1dIDwtIHJvd0RhdGEobHBfd2FudGVkKVtbImFubm90X2Nocm9tb3NvbWUiXV0Kc3VtbWFyeV9kZltbImNocm9tb3NvbWUiXV0gPC0gYXMuZmFjdG9yKHN1bW1hcnlfZGZbWyJjaHJvbW9zb21lIl1dKQpsZXZlbHMoc3VtbWFyeV9kZltbImNocm9tb3NvbWUiXV0pIDwtIGMoc2VxX2xlbigxOSksICIyMC4xIiwgIjIwLjIiLCAyMTozNSkKCnN1bW1hcnlfZGYgPC0gc3VtbWFyeV9kZlssIGMoImdlbmVfbWVhbiIsICJjaHJvbW9zb21lIildICU+JQogIGdyb3VwX2J5KGNocm9tb3NvbWUpICU+JQogIHN1bW1hcml6ZShjaHJfbWVhbiA9IG1lYW4oZ2VuZV9tZWFuLCBuYS5ybSA9IFRSVUUpKQoKbWluX3Jwa20gPC0gbWluKHN1bW1hcnlfZGZbWyJjaHJfbWVhbiJdXSkKc3VtbWFyeV9kZltbImNocl9tZWFuIl1dIDwtIHN1bW1hcnlfZGZbWyJjaHJfbWVhbiJdXSAvIG1pbl9ycGttCgpnZ3Bsb3Qoc3VtbWFyeV9kZiwgYWVzKHkgPSBjaHJvbW9zb21lLCB4ID0gY2hyX21lYW4pKSArCiAgZ2VvbV9jb2woKQoKd2FudGVkIDwtIGNvbERhdGEobHBfd2FudGVkKVtbImtubnYyY2xhc3NpZmljYXRpb24iXV0gPT0gInoyMiIgfCBjb2xEYXRhKGxwX3dhbnRlZClbWyJrbm52MmNsYXNzaWZpY2F0aW9uIl1dID09ICJ6MjMiCmxwX3ogPC0gbHBfd2FudGVkWywgd2FudGVkXQp6MjJfc2FtcGxlcyA8LSBjb2xEYXRhKGxwX3opW1sia25udjJjbGFzc2lmaWNhdGlvbiJdXSA9PSAiejIyIgp6MjNfc2FtcGxlcyA8LSBjb2xEYXRhKGxwX3opW1sia25udjJjbGFzc2lmaWNhdGlvbiJdXSA9PSAiejIzIgpscF96X2Fzc2F5IDwtIGFzLmRhdGEuZnJhbWUoYXNzYXkobHBfeikpCmxwX3pfYXNzYXlbWyJ6MjJfZ2VuZV9tZWFuIl1dIDwtIHJvd01lYW5zKGxwX3pfYXNzYXlbLCB6MjJfc2FtcGxlc10sIG5hLnJtID0gVFJVRSkKbHBfel9hc3NheVtbInoyM19nZW5lX21lYW4iXV0gPC0gcm93TWVhbnMobHBfel9hc3NheVssIHoyM19zYW1wbGVzXSwgbmEucm0gPSBUUlVFKQpscF96X2Fzc2F5W1siY2hyb21vc29tZSJdXSA8LSByb3dEYXRhKGxwX3opW1siYW5ub3RfY2hyb21vc29tZSJdXQpscF96X21lYW5zIDwtIGxwX3pfYXNzYXlbLCBjKCJ6MjJfZ2VuZV9tZWFuIiwgInoyM19nZW5lX21lYW4iLCAiY2hyb21vc29tZSIpXSAlPiUKICBncm91cF9ieShjaHJvbW9zb21lKSAlPiUKICBzdW1tYXJpemUoejIyX21lYW4gPSBtZWFuKHoyMl9nZW5lX21lYW4sIG5hLnJtID0gVFJVRSksCiAgICAgICAgICAgIHoyM19tZWFuID0gbWVhbih6MjNfZ2VuZV9tZWFuLCBuYS5ybSA9IFRSVUUpKQoKY2hyX3Jlc2hhcGVkIDwtIHJlc2hhcGUyOjptZWx0KGxwX3pfbWVhbnMsIGlkLnZhcnMgPSAiY2hyb21vc29tZSIpCmNocl9yZXNoYXBlZFtbImNocm9tb3NvbWUiXV0gPC0gZmFjdG9yKGNocl9yZXNoYXBlZFtbImNocm9tb3NvbWUiXV0sCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgIGxldmVscyA9IGMoYXMuY2hhcmFjdGVyKDE6MTkpLCAiMjAuMSIsICIyMC4yIiwKICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICBhcy5jaGFyYWN0ZXIoMjE6MzUpKSkKCnB1dGF0aXZlX2FuZXVwbG9pZCA8LSBnZ3Bsb3QoY2hyX3Jlc2hhcGVkLCBhZXMoeCA9IHZhbHVlLCB5ID0gY2hyb21vc29tZSkpICsKICBnZW9tX2JhcihhZXMoZmlsbCA9IHZhcmlhYmxlKSwgcG9zaXRpb24gPSAiZG9kZ2UiLCBzdGF0ID0gImlkZW50aXR5IikKcHAoZmlsZSA9ICJpbWFnZXMvcHV0YXRpdmVfYW5ldXBsb2lkLnN2ZyIpCnB1dGF0aXZlX2FuZXVwbG9pZApkZXYub2ZmKCkKcHV0YXRpdmVfYW5ldXBsb2lkCmBgYAoKIyBTYXZlIGFsbCBkYXRhIHN0cnVjdHVyZXMgaW50byBvbmUgcmRhCgpgYGB7cn0KZm91bmRfaWR4IDwtIGRhdGFfc3RydWN0dXJlcyAlaW4lIGxzKCkKaWYgKHN1bSghZm91bmRfaWR4KSA+IDApIHsKICBub3RfZm91bmQgPC0gZGF0YV9zdHJ1Y3R1cmVzWyFmb3VuZF9pZHhdCiAgd2FybmluZygiU29tZSBkYXRhc3RydWN0dXJlcyB3ZXJlIG5vdCBnZW5lcmF0ZWQ6ICIsIHRvU3RyaW5nKG5vdF9mb3VuZCksICIuIikKICBkYXRhX3N0cnVjdHVyZXMgPC0gZGF0YV9zdHJ1Y3R1cmVzW2ZvdW5kX2lkeF0KfQpzYXZlKGxpc3QgPSBkYXRhX3N0cnVjdHVyZXMsIGZpbGUgPSBnbHVlKCJyZGEvdG1yYzJfZGF0YV9zdHJ1Y3R1cmVzLXZ7dmVyfS5yZGEiKSkKYGBgCgpgYGB7cn0KcGFuZGVyOjpwYW5kZXIoc2Vzc2lvbkluZm8oKSkKbWVzc2FnZSgiVGhpcyBpcyBocGdsdG9vbHMgY29tbWl0OiAiLCBnZXRfZ2l0X2NvbW1pdCgpKQptZXNzYWdlKCJTYXZpbmcgdG8gIiwgc2F2ZWZpbGUpCiMgdG1wIDwtIHNtKHNhdmVtZShmaWxlbmFtZSA9IHNhdmVmaWxlKSkKYGBgCgpgYGB7ciBsb2FkbWVfYWZ0ZXIsIGV2YWw9RkFMU0V9CnRtcCA8LSBsb2FkbWUoZmlsZW5hbWUgPSBzYXZlZmlsZSkKYGBgCg==

TMRC2 202510: Data Set Creation

atb abelew@gmail.com

2025-10-13