Misc fixes to the handling of quality metrics data for SRA restore

bbimber · bbimber · commit 0bcb10082fda · 2022-04-08T10:19:17.000-07:00
diff --git a/SequenceAnalysis/src/org/labkey/sequenceanalysis/pipeline/ReadsetCreationTask.java b/SequenceAnalysis/src/org/labkey/sequenceanalysis/pipeline/ReadsetCreationTask.java
@@ -547,6 +547,25 @@ private Long getTotalReadsForFile(int fileId, int readsetId)
 
     public static long addQualityMetricsForReadset(Readset rs, int fileId, PipelineJob job) throws PipelineJobException
     {
+        return addQualityMetricsForReadset(rs, fileId, job, false);
+    }
+
+    public static long addQualityMetricsForReadset(Readset rs, int fileId, PipelineJob job, boolean deleteExisting) throws PipelineJobException
+    {
+        if (deleteExisting)
+        {
+            //update metrics. first delete existing:
+            SimpleFilter metricsFilter = new SimpleFilter(FieldKey.fromString("readset"), rs.getRowId());
+            metricsFilter.addCondition(FieldKey.fromString("container"), rs.getContainer());
+            metricsFilter.addCondition(FieldKey.fromString("dataId"), fileId);
+            int deleted = Table.delete(SequenceAnalysisManager.get().getTable(SequenceAnalysisSchema.TABLE_QUALITY_METRICS), metricsFilter);
+            job.getLogger().debug("existing metrics deleted: " + deleted);
+        }
+        else
+        {
+            job.getLogger().debug("will not attempt to pre-delete existing metrics");
+        }
+
         try
         {
             ExpData d = ExperimentService.get().getExpData(fileId);
diff --git a/SequenceAnalysis/src/org/labkey/sequenceanalysis/run/RestoreSraDataHandler.java b/SequenceAnalysis/src/org/labkey/sequenceanalysis/run/RestoreSraDataHandler.java
@@ -13,6 +13,7 @@
 import org.labkey.api.data.SimpleFilter;
 import org.labkey.api.data.Table;
 import org.labkey.api.data.TableInfo;
+import org.labkey.api.data.TableSelector;
 import org.labkey.api.exp.api.DataType;
 import org.labkey.api.exp.api.ExpData;
 import org.labkey.api.exp.api.ExperimentService;
@@ -37,15 +38,14 @@
 import org.labkey.api.sequenceanalysis.run.SimpleScriptWrapper;
 import org.labkey.api.util.Compress;
 import org.labkey.api.util.FileUtil;
+import org.labkey.api.util.PageFlowUtil;
 import org.labkey.api.util.Pair;
 import org.labkey.api.writer.PrintWriters;
 import org.labkey.sequenceanalysis.ReadDataImpl;
-import org.labkey.sequenceanalysis.SequenceAnalysisManager;
 import org.labkey.sequenceanalysis.SequenceAnalysisModule;
 import org.labkey.sequenceanalysis.SequenceAnalysisSchema;
 import org.labkey.sequenceanalysis.pipeline.ReadsetCreationTask;
 import org.labkey.sequenceanalysis.pipeline.SequenceNormalizationTask;
-import org.labkey.sequenceanalysis.pipeline.SequenceReadsetHandlerJob;
 import org.labkey.sequenceanalysis.util.SequenceUtil;
 
 import java.io.File;
@@ -167,19 +167,19 @@ public void init(PipelineJob job, SequenceAnalysisJobSupport support, List<Reads
             {
                 for (String accession : readdataToSra.keySet())
                 {
-                    if (readdataToSra.get(accession).size() > 1)
+                    List<ReadData> toMerge = readdataToSra.get(accession);
+                    if (toMerge.stream().map(ReadData::isArchived).collect(Collectors.toSet()).size() > 1)
                     {
-                        List<ReadData> toMerge = readdataToSra.get(accession);
-                        if (toMerge.stream().map(ReadData::isArchived).collect(Collectors.toSet()).size() > 1)
-                        {
-                            throw new PipelineJobException("SRA group contains a mix of archived and non-archived readdata: " + accession);
-                        }
+                        throw new PipelineJobException("SRA group contains a mix of archived and non-archived readdata: " + accession);
+                    }
 
-                        if (!toMerge.get(0).isArchived())
-                        {
-                            continue;
-                        }
+                    if (!toMerge.get(0).isArchived())
+                    {
+                        continue;
+                    }
 
+                    if (readdataToSra.get(accession).size() > 1)
+                    {
                         job.getLogger().debug("Consolidating multiple readdata for: " + accession);
 
                         ReadDataImpl rd = new ReadDataImpl();
@@ -221,9 +221,6 @@ public void init(PipelineJob job, SequenceAnalysisJobSupport support, List<Reads
                         rd.setCreatedBy(job.getUser().getUserId());
                         rd.setModifiedBy(job.getUser().getUserId());
                         rd.setPlatformUnit(accession);
-                        int totalReads = toMerge.stream().map(ReadData::getTotalReads).reduce(0, Integer::sum);
-                        accessionToReads.put(accession, totalReads);
-                        job.getLogger().debug("Total reads from prior data: " + totalReads);
 
                         job.getLogger().debug("Merging readdata for accession: " + accession);
                         File sraLog = new File(data1.getFile().getParentFile(), FileUtil.makeLegalName("sraDownload.txt"));
@@ -248,6 +245,10 @@ public void init(PipelineJob job, SequenceAnalysisJobSupport support, List<Reads
                         }
                         updatedAccessions.add(accession);
                     }
+
+                    int totalReads = toMerge.stream().map(ReadData::getTotalReads).reduce(0, Integer::sum);
+                    job.getLogger().debug("Total reads from prior data: " + totalReads);
+                    accessionToReads.put(accession, totalReads);
                 }
 
                 transaction.commit();
@@ -298,23 +299,28 @@ public void complete(PipelineJob job, List<Readset> readsets, List<SequenceOutpu
 
                     rows.add(toUpdate);
 
-                    List<Integer> toAdd = new ArrayList<>(rd.getFileId1());
-                    if (rd.getFileId2() != null)
+                    SimpleFilter filter = new SimpleFilter(FieldKey.fromString("readset"), rs.getRowId());
+                    filter.addCondition(FieldKey.fromString("category"), "Readset");
+                    filter.addCondition(FieldKey.fromString("container"), rs.getContainer());
+                    filter.addCondition(FieldKey.fromString("dataId"), rd.getFileId1());
+                    boolean hasMetrics = new TableSelector(SequenceAnalysisSchema.getTable(SequenceAnalysisSchema.TABLE_QUALITY_METRICS), PageFlowUtil.set("RowId"), filter, null).exists();
+                    if (!hasMetrics)
                     {
-                        toAdd.add(rd.getFileId2());
-                    }
+                        List<Integer> toAdd = new ArrayList<>(rd.getFileId1());
+                        if (rd.getFileId2() != null)
+                        {
+                            toAdd.add(rd.getFileId2());
+                        }
 
-                    for (int dataId : toAdd)
+                        for (int dataId : toAdd)
+                        {
+                            //then delete/add:
+                            ReadsetCreationTask.addQualityMetricsForReadset(rs, dataId, job, true);
+                        }
+                    }
+                    else
                     {
-                        //update metrics. first delete existing:
-                        SimpleFilter filter = new SimpleFilter(FieldKey.fromString("readset"), rs.getRowId());
-                        filter.addCondition(FieldKey.fromString("container"), rs.getContainer());
-                        filter.addCondition(FieldKey.fromString("dataId"), dataId);
-                        int deleted = Table.delete(SequenceAnalysisManager.get().getTable(SequenceAnalysisSchema.TABLE_QUALITY_METRICS), filter);
-                        job.getLogger().debug("existing metrics deleted: " + deleted);
-
-                        //then add:
-                        ReadsetCreationTask.addQualityMetricsForReadset(rs, dataId, job);
+                        job.getLogger().info("Existing metrics found, will not re-import");
                     }
 
                     Map<String, Object> rsUpdate = new HashMap<>();