LabKey
diff --git a/‎SequenceAnalysis/resources/external/scRNAseq/htoClassifier.Rmd‎
Lines changed: 2 additions & 2 deletions b/‎SequenceAnalysis/resources/external/scRNAseq/htoClassifier.Rmd‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎SequenceAnalysis/resources/queries/sequenceanalysis/quality_metrics_analyses_pivoted.query.xml‎
Lines changed: 14 additions & 0 deletions b/‎SequenceAnalysis/resources/queries/sequenceanalysis/quality_metrics_analyses_pivoted.query.xml‎
Lines changed: 14 additions & 0 deletions
diff --git a/‎SequenceAnalysis/resources/queries/sequenceanalysis/quality_metrics_analyses_pivoted.sql‎
Lines changed: 13 additions & 0 deletions b/‎SequenceAnalysis/resources/queries/sequenceanalysis/quality_metrics_analyses_pivoted.sql‎
Lines changed: 13 additions & 0 deletions
diff --git a/‎SequenceAnalysis/resources/queries/sequenceanalysis/quality_metrics_pivoted.query.xml‎
Lines changed: 1 addition & 1 deletion b/‎SequenceAnalysis/resources/queries/sequenceanalysis/quality_metrics_pivoted.query.xml‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎SequenceAnalysis/resources/schemas/sequenceanalysis.xml‎
Lines changed: 9 additions & 0 deletions b/‎SequenceAnalysis/resources/schemas/sequenceanalysis.xml‎
Lines changed: 9 additions & 0 deletions
diff --git a/‎SequenceAnalysis/src/org/labkey/sequenceanalysis/SequenceAnalysisModule.java‎
Lines changed: 2 additions & 0 deletions b/‎SequenceAnalysis/src/org/labkey/sequenceanalysis/SequenceAnalysisModule.java‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎SequenceAnalysis/src/org/labkey/sequenceanalysis/SequenceProvider.java‎
Lines changed: 4 additions & 0 deletions b/‎SequenceAnalysis/src/org/labkey/sequenceanalysis/SequenceProvider.java‎
Lines changed: 4 additions & 0 deletions
diff --git a/‎SequenceAnalysis/src/org/labkey/sequenceanalysis/pipeline/TaskFileManagerImpl.java‎
Lines changed: 1 addition & 0 deletions b/‎SequenceAnalysis/src/org/labkey/sequenceanalysis/pipeline/TaskFileManagerImpl.java‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎SequenceAnalysis/src/org/labkey/sequenceanalysis/run/alignment/CellRangerWrapper.java‎
Lines changed: 9 additions & 37 deletions b/‎SequenceAnalysis/src/org/labkey/sequenceanalysis/run/alignment/CellRangerWrapper.java‎
Lines changed: 9 additions & 37 deletions
diff --git a/‎SequenceAnalysis/src/org/labkey/sequenceanalysis/run/analysis/LofreqAnalysis.java‎
Lines changed: 41 additions & 18 deletions b/‎SequenceAnalysis/src/org/labkey/sequenceanalysis/run/analysis/LofreqAnalysis.java‎
Lines changed: 41 additions & 18 deletions
@@ -19,7 +19,7 @@ if (cores != ''){
 
 ## Basic QC and Filtering on input:
 
-```{r QC}
+```{r QC, fig.width=12}
 
 barcodeData <- ProcessCiteSeqCount(bFile = barcodeDir, doRowFilter = doHtoFilter, maxValueForColSumFilter = maxValueForColSumFilter)
 if (nrow(barcodeData) == 0) {
@@ -38,7 +38,7 @@ if (nrow(barcodeData) > 0 && ncol(barcodeData) > 0){
 
 ## Generate calls
 
-```{r GenerateCalls}
+```{r GenerateCalls, fig.width=12}
 
 if (nrow(barcodeData) > 0 && ncol(barcodeData) > 0){
     dt <- GenerateCellHashingCalls(barcodeData = barcodeData, outFile = finalCallFile, allCallsOutFile = allCallsOutFile)
 
@@ -0,0 +1,14 @@
+<query xmlns="http://labkey.org/data/xml/query">
+    <metadata>
+        <tables xmlns="http://labkey.org/data/xml">
+            <table tableName="quality_metrics_analyses_pivoted" tableDbType="TABLE">
+                <tableTitle>Quality Metrics By Analysis</tableTitle>
+                <columns>
+                    <column columnName="analysis_id">
+                        <isKeyField>true</isKeyField>
+                    </column>
+                </columns>
+            </table>
+        </tables>
+    </metadata>
+</query>
@@ -0,0 +1,13 @@
+select
+  analysis_id,
+  max(readset) as readset,
+  --container,
+  max(category) as category,
+  count(*) as records,
+  metricName,
+  avg(metricValue) as metricValue
+
+from sequenceanalysis.quality_metrics q
+where (category is null or category not in ('FIRST_OF_PAIR', 'SECOND_OF_PAIR'))
+group by analysis_id, metricName
+pivot metricValue by metricName
@@ -2,7 +2,7 @@
     <metadata>
         <tables xmlns="http://labkey.org/data/xml">
             <table tableName="quality_metrics_pivoted" tableDbType="TABLE">
-                <tableTitle>Quality Metrics</tableTitle>
+                <tableTitle>Quality Metrics By File</tableTitle>
                 <columns>
                     <column columnName="dataId">
                         <isKeyField>true</isKeyField>
 
@@ -484,6 +484,15 @@
                 <columnTitle>SRA Run</columnTitle>
                 <url>https://trace.ncbi.nlm.nih.gov/Traces/sra/?run=${sra_accession}</url>
             </column>
+            <column columnName="metrics" wrappedColumnName="rowid">
+                <columnTitle>Quality Metrics</columnTitle>
+                <isUnselectable>true</isUnselectable>
+                <fk>
+                    <fkDbSchema>sequenceanalysis</fkDbSchema>
+                    <fkTable>quality_metrics_analyses_pivoted</fkTable>
+                    <fkColumnName>analysis_id</fkColumnName>
+                </fk>
+            </column>
         </columns>
         <buttonBarOptions includeStandardButtons="false">
             <includeScript>laboratory.context</includeScript>
 
@@ -81,6 +81,7 @@
 import org.labkey.sequenceanalysis.run.analysis.LofreqAnalysis;
 import org.labkey.sequenceanalysis.run.analysis.MergeLoFreqVcfHandler;
 import org.labkey.sequenceanalysis.run.analysis.PARalyzerAnalysis;
+import org.labkey.sequenceanalysis.run.analysis.PindelAnalysis;
 import org.labkey.sequenceanalysis.run.analysis.SequenceBasedTypingAnalysis;
 import org.labkey.sequenceanalysis.run.analysis.SnpCountAnalysis;
 import org.labkey.sequenceanalysis.run.analysis.SubreadAnalysis;
@@ -281,6 +282,7 @@ public static void registerPipelineSteps()
         SequencePipelineService.get().registerPipelineStep(new SubreadAnalysis.Provider());
         SequencePipelineService.get().registerPipelineStep(new TagPcrSummaryStep.Provider());
         SequencePipelineService.get().registerPipelineStep(new LofreqAnalysis.Provider());
+        SequencePipelineService.get().registerPipelineStep(new PindelAnalysis.Provider());
 
         //SequencePipelineService.get().registerPipelineStep(new BlastUnmappedReadAnalysis.Provider());
         SequencePipelineService.get().registerPipelineStep(new PARalyzerAnalysis.Provider());
 
@@ -219,12 +219,16 @@ public List<TabbedReportItem> getTabbedReportItems(Container c, User u)
         TabbedReportItem analyses = new QueryTabbedReportItem(cache, this, SequenceAnalysisSchema.SCHEMA_NAME, SequenceAnalysisSchema.TABLE_ANALYSES, "Sequence Analyses", category);
         analyses.setSubjectIdFieldKey(FieldKey.fromString("readset/subjectid"));
         analyses.setSampleDateFieldKey(FieldKey.fromString("readset/sampledate"));
+        analyses.setAllProjectsFieldKey(FieldKey.fromString("readset/allProjectsPivot"));
+        analyses.setOverlappingProjectsFieldKey(FieldKey.fromString("readset/overlappingProjectsPivot"));
         analyses.setOwnerKey(owner.getPropertyManagerKey());
         items.add(analyses);
 
         TabbedReportItem outputs = new QueryTabbedReportItem(cache, this, SequenceAnalysisSchema.SCHEMA_NAME, SequenceAnalysisSchema.TABLE_OUTPUTFILES, "Sequence Outputs", category);
         outputs.setSubjectIdFieldKey(FieldKey.fromString("readset/subjectid"));
         outputs.setSampleDateFieldKey(FieldKey.fromString("readset/sampledate"));
+        outputs.setAllProjectsFieldKey(FieldKey.fromString("readset/allProjectsPivot"));
+        outputs.setOverlappingProjectsFieldKey(FieldKey.fromString("readset/overlappingProjectsPivot"));
         outputs.setOwnerKey(owner.getPropertyManagerKey());
         items.add(outputs);
 
 
@@ -836,6 +836,7 @@ public void cleanup(Collection<RecordedAction> actions, @Nullable AbstractResume
     {
         _job.getLogger().debug("performing file cleanup");
         _job.setStatus(PipelineJob.TaskStatus.running, "PERFORMING FILE CLEANUP");
+        _job.setErrors(0);
 
         _job.getLogger().debug("transferring " + _outputsToCreate.size() + " sequence outputs to pipeline job, existing: " + _job.getOutputsToCreate().size());
         for (SequenceOutputFile so : _outputsToCreate)
 
@@ -61,6 +61,8 @@
 
 public class CellRangerWrapper extends AbstractCommandWrapper
 {
+    public static final String GTF_FILE = "GTF File";
+
     public CellRangerWrapper(@Nullable Logger logger)
     {
         super(logger);
@@ -94,10 +96,7 @@ public Provider()
                         put("extensions", Arrays.asList("gtf"));
                         put("width", 400);
                         put("allowBlank", false);
-                    }}, null),
-                    ToolParameterDescriptor.create("premrna", "Use pre-mRNA GTF", "Normally, reads are only counted if they overlap exons.  If selected, the pipeline will convert the GTF to list all transcript intervals as exon, meaning reads within introns will be counted as well.  This could be useful for single-nuclei sequencing (which captures pre-mRNA), or if your GTF exon annotations may be lacking.", "checkbox", new JSONObject(){{
-
-                    }}, false)
+                    }}, null)
             ), PageFlowUtil.set("sequenceanalysis/field/GenomeFileSelectorField.js"), "https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/what-is-cell-ranger", true, false, ALIGNMENT_MODE.MERGE_THEN_ALIGN);
         }
 
@@ -138,7 +137,6 @@ public String getAlignmentDescription()
 
         protected static String getAlignDescription(PipelineStepProvider provider, PipelineContext ctx, int stepIdx, boolean addAligner)
         {
-            boolean isPreMrna = isPreMrna(provider, ctx, stepIdx);
             Integer gtfId = provider.getParameterByName("gtfFile").extractValue(ctx.getJob(), provider, stepIdx, Integer.class);
             File gtfFile = ctx.getSequenceSupport().getCachedData(gtfId);
             if (gtfFile == null)
@@ -161,11 +159,6 @@ protected static String getAlignDescription(PipelineStepProvider provider, Pipel
                 lines.add("GTF: " + gtfFile.getName());
             }
 
-            if (isPreMrna)
-            {
-                lines.add("Converted to pre-mRNA GTF");
-            }
-
             return lines.isEmpty() ? null : StringUtils.join(lines, '\n');
         }
 
@@ -178,14 +171,7 @@ public String getIndexCachedDirName(PipelineJob job)
                 throw new IllegalArgumentException("Missing gtfFile parameter");
             }
 
-            boolean premrna = isPreMrna(getProvider(), getPipelineCtx(), getStepIdx());
-
-            return "cellRanger-" + gtfId + (premrna ? "-premrna" : "");
-        }
-
-        private static boolean isPreMrna(PipelineStepProvider provider, PipelineContext ctx, int stepIdx)
-        {
-            return provider.getParameterByName("premrna").extractValue(ctx.getJob(), provider, stepIdx, Boolean.class, false);
+            return "cellRanger-" + gtfId;
         }
 
         @Override
@@ -227,13 +213,6 @@ public IndexOutput createIndex(ReferenceGenome referenceGenome, File outputDir)
 
                 File gtfEdit = new File(indexDir.getParentFile(), FileUtil.getBaseName(gtfFile) + ".geneId.gtf");
 
-                //See: https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/advanced/references
-                boolean premrna = getProvider().getParameterByName("premrna").extractValue(getPipelineCtx().getJob(), getProvider(), getStepIdx(), Boolean.class, false);
-                if (premrna)
-                {
-                    getPipelineCtx().getLogger().debug("Creating a pre-mRNA version of the GTF");
-                }
-
                 try (CSVReader reader = new CSVReader(Readers.getReader(gtfFile), '\t', CSVWriter.NO_QUOTE_CHARACTER); CSVWriter writer = new CSVWriter(PrintWriters.getPrintWriter(gtfEdit), '\t', CSVWriter.NO_QUOTE_CHARACTER, CSVWriter.NO_ESCAPE_CHARACTER))
                 {
                     String[] line;
@@ -252,12 +231,6 @@ public IndexOutput createIndex(ReferenceGenome referenceGenome, File outputDir)
                             continue;
                         }
 
-                        if (premrna && "transcript".equalsIgnoreCase(line[2]))
-                        {
-                            exonsAdded++;
-                            line[2] = "exon";
-                        }
-
                         writer.writeNext(line);
                     }
                 }
@@ -271,12 +244,7 @@ public IndexOutput createIndex(ReferenceGenome referenceGenome, File outputDir)
                     getPipelineCtx().getLogger().info("dropped " + linesDropped + " lines lacking gene_id, transcript_id, or with an empty value for gene_id/transcript_id");
                 }
 
-                if (premrna)
-                {
-                    getPipelineCtx().getLogger().info("total transcripts converted to exon: " + exonsAdded);
-                }
-
-                boolean useAlternateGtf = linesDropped > 0 || premrna;
+                boolean useAlternateGtf = linesDropped > 0;
                 if (useAlternateGtf)
                 {
                     gtfFile = gtfEdit;
@@ -365,6 +333,10 @@ public AlignmentOutput performAlignment(Readset rs, File inputFastq1, @Nullable
                 args.add("--sample=" + StringUtils.join(sampleNames, ","));
             }
 
+            Integer gtfId = getProvider().getParameterByName("gtfFile").extractValue(getPipelineCtx().getJob(), getProvider(), getStepIdx(), Integer.class);
+            File gtfFile = getPipelineCtx().getSequenceSupport().getCachedData(gtfId);
+            output.addInput(gtfFile, GTF_FILE);
+
             File indexDir = AlignerIndexUtil.getWebserverIndexDir(referenceGenome, getIndexCachedDirName(getPipelineCtx().getJob()));
             args.add("--transcriptome=" + indexDir.getPath());
 
 
@@ -116,9 +116,23 @@ public Provider()
                         put("minValue", 0.5);
                         put("maxValue", 1.0);
                         put("decimalPrecision", 2);
-                    }}, 0.5)
+                    }}, 0.5),
+                    ToolParameterDescriptor.create("minFraction", "Pindel Min Fraction To Report", "Only variants representing at least this fraction of reads (based on depth at the start position) will be reported.", "ldk-numberfield", new JSONObject()
+                    {{
+                        put("minValue", 0.0);
+                        put("maxValue", 1.0);
+                        put("decimalPrecision", 2);
+                    }}, 0.1),
+                    ToolParameterDescriptor.create("minDepth", "Pindel Min Depth To Report", "Only variants representing at least this many reads (based on depth at the start position) will be reported.", "ldk-integerfield", new JSONObject()
+                    {{
+                        put("minValue", 0);
+                    }}, 10),
+                    ToolParameterDescriptor.create("minInsertSize", "Min Insert Size", "Normally this tool will use the value of Picard CollectInsertSizeMetrics as the mean insert size to pass to pindel; however, this value can be used to set a minimum.", "ldk-integerfield", new JSONObject()
+                    {{
+                        put("minValue", 0);
+                    }}, 200)
 
-            ), null, "http://csb5.github.io/lofreq/");
+                    ), PageFlowUtil.set("sequenceanalysis/field/GenomeFileSelectorField.js"), "http://csb5.github.io/lofreq/");
         }
 
 
@@ -129,22 +143,9 @@ public LofreqAnalysis create(PipelineContext ctx)
         }
     }
 
-
-    @Override
-    public Output performAnalysisPerSampleRemote(Readset rs, File inputBam, ReferenceGenome referenceGenome, File outputDir) throws PipelineJobException
+    public static void runDepthOfCoverage(PipelineContext ctx, AnalysisOutputImpl output, File outputDir, ReferenceGenome referenceGenome, File inputBam, File coverageOut) throws PipelineJobException
     {
-        AnalysisOutputImpl output = new AnalysisOutputImpl();
-
-        File outputVcf = new File(outputDir, FileUtil.getBaseName(inputBam) + ".lofreq.vcf.gz");
-        File outputVcfSnpEff = new File(outputDir, FileUtil.getBaseName(inputBam) + ".lofreq.snpeff.vcf.gz");
-
-        //LoFreq
-        getWrapper().execute(inputBam, outputVcf, referenceGenome.getWorkingFastaFile(), SequencePipelineService.get().getMaxThreads(getPipelineCtx().getLogger()));
-
-        //Add depth for downstream use:
-        File coverageOut = new File(outputDir, SequenceAnalysisService.get().getUnzippedBaseName(outputVcf.getName()) + ".coverage");
-
-        DepthOfCoverageWrapper wrapper = new DepthOfCoverageWrapper(getPipelineCtx().getLogger());
+        DepthOfCoverageWrapper wrapper = new DepthOfCoverageWrapper(ctx.getLogger());
         List<String> extraArgs = new ArrayList<>();
         extraArgs.add("--include-deletions");
         extraArgs.add("--omit-per-sample-statistics");
@@ -159,6 +160,22 @@ public Output performAnalysisPerSampleRemote(Readset rs, File inputBam, Referenc
         {
             throw new PipelineJobException("Unable to find file: " + coverageOut.getPath());
         }
+    }
+
+    @Override
+    public Output performAnalysisPerSampleRemote(Readset rs, File inputBam, ReferenceGenome referenceGenome, File outputDir) throws PipelineJobException
+    {
+        AnalysisOutputImpl output = new AnalysisOutputImpl();
+
+        File outputVcf = new File(outputDir, FileUtil.getBaseName(inputBam) + ".lofreq.vcf.gz");
+        File outputVcfSnpEff = new File(outputDir, FileUtil.getBaseName(inputBam) + ".lofreq.snpeff.vcf.gz");
+
+        //LoFreq
+        getWrapper().execute(inputBam, outputVcf, referenceGenome.getWorkingFastaFile(), SequencePipelineService.get().getMaxThreads(getPipelineCtx().getLogger()));
+
+        //Add depth for downstream use:
+        File coverageOut = new File(outputDir, SequenceAnalysisService.get().getUnzippedBaseName(outputVcf.getName()) + ".coverage");
+        runDepthOfCoverage(getPipelineCtx(), output, outputDir, referenceGenome, inputBam, coverageOut);
 
         //Create a BED file with all regions of coverage below MIN_COVERAGE:
         int minCoverage = getProvider().getParameterByName("minCoverage").extractValue(getPipelineCtx().getJob(), getProvider(), getStepIdx(), Integer.class);
@@ -306,7 +323,7 @@ public Output performAnalysisPerSampleRemote(Readset rs, File inputBam, Referenc
 
         //SnpEff:
         Integer geneFileId = getProvider().getParameterByName(SNPEffStep.GENE_PARAM).extractValue(getPipelineCtx().getJob(), getProvider(), getStepIdx(), Integer.class);
-        File snpEffBaseDir = SNPEffStep.checkOrCreateIndex(getPipelineCtx(), referenceGenome, geneFileId);
+        File snpEffBaseDir = SNPEffStep.checkOrCreateIndex(getPipelineCtx().getSequenceSupport(), getPipelineCtx().getLogger(), referenceGenome, geneFileId);
 
         SnpEffWrapper snpEffWrapper = new SnpEffWrapper(getPipelineCtx().getLogger());
         snpEffWrapper.runSnpEff(referenceGenome.getGenomeId(), geneFileId, snpEffBaseDir, outputVcf, outputVcfSnpEff, null);
@@ -569,6 +586,12 @@ public Output performAnalysisPerSampleRemote(Readset rs, File inputBam, Referenc
             throw new PipelineJobException(e);
         }
 
+        Double minFraction = getProvider().getParameterByName("minFraction").extractValue(getPipelineCtx().getJob(), getProvider(), getStepIdx(), Double.class, 0.0);
+        int minDepth = getProvider().getParameterByName("minDepth").extractValue(getPipelineCtx().getJob(), getProvider(), getStepIdx(), Integer.class, 0);
+        int minInsertSize = getProvider().getParameterByName("minInsertSize").extractValue(getPipelineCtx().getJob(), getProvider(), getStepIdx(), Integer.class, 0);
+
+        PindelAnalysis.runPindel(output, getPipelineCtx(), rs, outputDir, inputBam, referenceGenome.getWorkingFastaFile(), minFraction, minDepth, true, coverageOut, minInsertSize);
+
         return output;
     }
Original file line number	Diff line number	Diff line change
`@@ -836,6 +836,7 @@ public void cleanup(Collection<RecordedAction> actions, @Nullable AbstractResume`
`836`	`836`	`{`
`837`	`837`	`_job.getLogger().debug("performing file cleanup");`
`838`	`838`	`_job.setStatus(PipelineJob.TaskStatus.running, "PERFORMING FILE CLEANUP");`
	`839`	`+ _job.setErrors(0);`
`839`	`840`
`840`	`841`	`_job.getLogger().debug("transferring " + _outputsToCreate.size() + " sequence outputs to pipeline job, existing: " + _job.getOutputsToCreate().size());`
`841`	`842`	`for (SequenceOutputFile so : _outputsToCreate)`