MITLibraries
diff --git a/‎.gitignore‎
Lines changed: 1 addition & 0 deletions b/‎.gitignore‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎addKeyValuePairOnHandleCSV.py‎
Lines changed: 53 additions & 0 deletions b/‎addKeyValuePairOnHandleCSV.py‎
Lines changed: 53 additions & 0 deletions
diff --git a/‎checkCommunityForKey.py‎
Lines changed: 72 additions & 0 deletions b/‎checkCommunityForKey.py‎
Lines changed: 72 additions & 0 deletions
diff --git a/‎postItem.py‎
Lines changed: 55 additions & 0 deletions b/‎postItem.py‎
Lines changed: 55 additions & 0 deletions
diff --git a/‎removeDuplicateKeyValuePairsFromItems.py‎
Lines changed: 79 additions & 0 deletions b/‎removeDuplicateKeyValuePairsFromItems.py‎
Lines changed: 79 additions & 0 deletions
diff --git a/‎replaceKey.py‎
Lines changed: 95 additions & 0 deletions b/‎replaceKey.py‎
Lines changed: 95 additions & 0 deletions
@@ -45,3 +45,4 @@ $RECYCLE.BIN/
 Network Trash Folder
 Temporary Items
 .apdisk
+secrets.py
@@ -0,0 +1,53 @@
+import json
+import requests
+import secrets
+import time
+import csv
+from datetime import datetime
+
+baseURL = secrets.baseURL
+email = secrets.email
+password = secrets.password
+filePath = secrets.filePath
+
+data = json.dumps({'email':email,'password':password})
+header = {'content-type':'application/json','accept':'application/json'}
+session = requests.post(baseURL+'/rest/login', headers=header, data=data).content
+headerAuth = {'content-type':'application/json','accept':'application/json', 'rest-dspace-token':session}
+
+filename = filePath+raw_input('Enter filename (including \'.csv\'): ')
+addedKey = raw_input('Enter key: ')
+startTime = time.time()
+
+f=csv.writer(open(filePath+'addKeyValuePair'+datetime.now().strftime('%Y-%m-%d %H.%M.%S')+'.csv', 'wb'))
+f.writerow(['itemID']+['addedKey']+['addedValue']+['delete']+['post'])
+
+with open(filename) as csvfile:
+    reader = csv.DictReader(csvfile)
+    for row in reader:
+        addedValue = row['value'].decode('utf-8')
+        handle = row['handle'].strip()
+        addedMetadataElement = {}
+        addedMetadataElement['key'] = addedKey
+        addedMetadataElement['value'] = unicode(addedValue)
+        addedMetadataElement['language'] = 'en_us'
+        endpoint = baseURL+'/rest/handle/'+handle
+        item = requests.get(endpoint, headers=header).json()
+        itemID = item['id']
+        itemMetadata = requests.get(baseURL+'/rest/items/'+str(itemID)+'/metadata', headers=headerAuth).json()
+        itemMetadata.append(addedMetadataElement)
+        itemMetadataProcessed = itemMetadata
+
+        provNote = '\''+addedKey+': '+addedValue+'\' was added through a batch process on '+datetime.now().strftime('%Y-%m-%d %H:%M:%S')+'.'
+        provNoteElement = {}
+        provNoteElement['key'] = 'dc.description.provenance'
+        provNoteElement['value'] = unicode(provNote)
+        provNoteElement['language'] = 'en_US'
+        itemMetadataProcessed.append(provNoteElement)
+
+        itemMetadataProcessed = json.dumps(itemMetadataProcessed)
+        delete = requests.delete(baseURL+'/rest/items/'+str(itemID)+'/metadata', headers=headerAuth)
+        print delete
+        post = requests.put(baseURL+'/rest/items/'+str(itemID)+'/metadata', headers=headerAuth, data=itemMetadataProcessed)
+        print post
+        f.writerow([itemID]+[addedMetadataElement['key']]+[addedMetadataElement['value'].encode('utf-8')]+[delete]+[post])
@@ -0,0 +1,72 @@
+import json
+import requests
+import secrets
+import csv
+import time
+
+baseURL = secrets.baseURL
+email = secrets.email
+password = secrets.password
+filePath = secrets.filePath
+
+communityID = raw_input('Enter community ID: ')
+
+key = raw_input('Enter key: ')
+
+startTime = time.time()
+data = json.dumps({'email':email,'password':password})
+header = {'content-type':'application/json','accept':'application/json'}
+session = requests.post(baseURL+'/rest/login', headers=header, data=data).content
+headerAuth = {'content-type':'application/json','accept':'application/json', 'rest-dspace-token':session}
+print 'authenticated'
+
+itemList = []
+endpoint = baseURL+'/rest/communities'
+collections = requests.get(baseURL+'/rest/communities/'+str(communityID)+'/collections', headers=headerAuth).json()
+for j in range (0, len (collections)):
+    collectionID = collections[j]['id']
+    if collectionID != 24:
+        offset = 0
+        items = ''
+        while items != []:
+            items = requests.get(baseURL+'/rest/collections/'+str(collectionID)+'/items?limit=1000&offset='+str(offset), headers=headerAuth)
+            while items.status_code != 200:
+                time.sleep(5)
+                items = requests.get(baseURL+'/rest/collections/'+str(collectionID)+'/items?limit=1000&offset='+str(offset), headers=headerAuth)
+            items = items.json()
+            for k in range (0, len (items)):
+                itemID = items[k]['id']
+                itemList.append(itemID)
+            offset = offset + 1000
+elapsedTime = time.time() - startTime
+m, s = divmod(elapsedTime, 60)
+h, m = divmod(m, 60)
+print 'Item list creation time: ','%d:%02d:%02d' % (h, m, s)
+
+valueList = {}
+for number, itemID in enumerate(itemList):
+    itemsRemaining = len(itemList) - number
+    print 'Items remaining: ', itemsRemaining, 'ItemID: ', itemID
+    metadata = requests.get(baseURL+'/rest/items/'+str(itemID)+'/metadata', headers=headerAuth).json()
+    valueList[itemID] = ''
+    for l in range (0, len (metadata)):
+        if metadata[l]['key'] == key:
+            metadataValue = metadata[l]['value'].encode('utf-8')
+            valueList[itemID] = metadataValue
+
+elapsedTime = time.time() - startTime
+m, s = divmod(elapsedTime, 60)
+h, m = divmod(m, 60)
+print 'Value list creation time: ','%d:%02d:%02d' % (h, m, s)
+
+f=csv.writer(open(filePath+key+'Values.csv', 'wb'))
+f.writerow(['itemID']+[key])
+for k, v in valueList.iteritems():
+    f.writerow([k]+[v])
+
+logout = requests.post(baseURL+'/rest/logout', headers=headerAuth)
+
+elapsedTime = time.time() - startTime
+m, s = divmod(elapsedTime, 60)
+h, m = divmod(m, 60)
+print 'Total script run time: ', '%d:%02d:%02d' % (h, m, s)
@@ -0,0 +1,55 @@
+import json
+import requests
+import secrets
+
+baseURL = secrets.baseURL
+email = secrets.email
+password = secrets.password
+filePath = secrets.filePath
+
+data = json.dumps({'email':email,'password':password})
+header = {'content-type':'application/json','accept':'application/json'}
+session = requests.post(baseURL+'/rest/login', headers=header, data=data).content
+headerAuth = {'content-type':'application/json','accept':'application/json', 'rest-dspace-token':session}
+headerAuthFileUpload = {'accept':'application/json', 'rest-dspace-token':session}
+print 'authenticated'
+
+#Post community
+communityName = 'Test Community'
+community = json.dumps({'name': communityName})
+post = requests.post(baseURL+'/rest/communities', headers=headerAuth, data=community).json()
+print post
+communityID = post['link']
+print communityID
+
+# #Post collection
+collectionName = 'Test Collection'
+collection = json.dumps({'name': collectionName})
+post = requests.post(baseURL+communityID+'/collections', headers=headerAuth, data=collection).json()
+print post
+collectionID = post['link']
+
+#Post item
+item = json.dumps({'metadata': [{'key': 'dc.title', 'language': 'en_US', 'value': 'testing123'}]})
+post = requests.post(baseURL+collectionID+'/items', headers=headerAuth, data=item).json()
+print post
+itemID = post['link']
+
+#Post bitstream
+#bitstream = filePath+'test.txt'
+bitstream = filePath+'testImage.jpg'
+fileName = bitstream[bitstream.rfind('/')+1:]
+files = {'file': open(bitstream, 'rb')}
+data = json.dumps({'name': fileName, 'sequenceId': 1})
+post = requests.post(baseURL+itemID+'/bitstreams', headers=headerAuthFileUpload, files=files).json()
+print post
+bitstreamID = '/rest/bitstreams/'+str(post['id'])
+post = requests.put(baseURL+bitstreamID, headers=headerAuth, data=data)
+print post
+
+# print baseURL+itemID+'/metadata'
+# item = json.dumps([{'key': 'dc.title', 'language': 'en_US', 'value': 'testing123'}])
+# post = requests.post(baseURL+itemID+'/metadata', headers=headerAuth, data=item).json()
+# print post
+
+logout = requests.post(baseURL+'/rest/logout', headers=headerAuth)
@@ -0,0 +1,79 @@
+import json
+import requests
+import secrets
+import time
+import csv
+from datetime import datetime
+
+baseURL = secrets.baseURL
+email = secrets.email
+password = secrets.password
+filePath = secrets.filePath
+
+startTime = time.time()
+data = json.dumps({'email':email,'password':password})
+header = {'content-type':'application/json','accept':'application/json'}
+session = requests.post(baseURL+'/rest/login', headers=header, data=data).content
+headerAuth = {'content-type':'application/json','accept':'application/json', 'rest-dspace-token':session}
+print 'authenticated'
+
+itemList = []
+endpoint = baseURL+'/rest/communities'
+communities = requests.get(endpoint, headers=headerAuth).json()
+for i in range (0, len (communities)):
+    communityID = communities[i]['id']
+    collections = requests.get(baseURL+'/rest/communities/'+str(communityID)+'/collections', headers=headerAuth).json()
+    for j in range (0, len (collections)):
+        collectionID = collections[j]['id']
+        if collectionID != 24:
+            offset = 0
+            items = ''
+            while items != []:
+                items = requests.get(baseURL+'/rest/collections/'+str(collectionID)+'/items?limit=1000&offset='+str(offset), headers=headerAuth)
+                while items.status_code != 200:
+                    time.sleep(5)
+                    items = requests.get(baseURL+'/rest/collections/'+str(collectionID)+'/items?limit=1000&offset='+str(offset), headers=headerAuth)
+                items = items.json()
+                for k in range (0, len (items)):
+                    itemID = items[k]['id']
+                    itemList.append(itemID)
+                offset = offset + 1000
+elapsedTime = time.time() - startTime
+m, s = divmod(elapsedTime, 60)
+h, m = divmod(m, 60)
+print 'Item list creation time: ','%d:%02d:%02d' % (h, m, s)
+
+f=csv.writer(open(filePath+'removeDuplicatesRecordsEdited'+datetime.now().strftime('%Y-%m-%d %H.%M.%S')+'.csv', 'wb'))
+f.writerow(['itemID'])
+for number, itemID in enumerate(itemList):
+    itemMetadataProcessed = []
+    itemsRemaining = len(itemList) - number
+    print 'Items remaining: ', itemsRemaining, 'ItemID: ', itemID
+    metadata = requests.get(baseURL+'/rest/items/'+str(itemID)+'/metadata', headers=headerAuth).json()
+    for l in range (0, len (metadata)):
+        if metadata[l] not in itemMetadataProcessed:
+            itemMetadataProcessed.append(metadata[l])
+        else:
+            if metadata[l]['key'] == 'dc.description.provenance':
+                itemMetadataProcessed.append(metadata[l])
+            else:
+                provNote = 'A duplicate element, \''+metadata[l]['key']+': '+metadata[l]['value']+',\' was removed through a batch process on '+datetime.now().strftime('%Y-%m-%d %H:%M:%S')+'.'
+                provNoteElement = {}
+                provNoteElement['key'] = 'dc.description.provenance'
+                provNoteElement['value'] = unicode(provNote)
+                provNoteElement['language'] = 'en_US'
+                itemMetadataProcessed.append(provNoteElement)
+    if itemMetadataProcessed != metadata:
+        itemMetadataProcessed = json.dumps(itemMetadataProcessed)
+        delete = requests.delete(baseURL+'/rest/items/'+str(itemID)+'/metadata', headers=headerAuth)
+        print delete
+        post = requests.put(baseURL+'/rest/items/'+str(itemID)+'/metadata', headers=headerAuth, data=itemMetadataProcessed)
+        print post
+        f.writerow([itemID])
+
+logout = requests.post(baseURL+'/rest/logout', headers=headerAuth)
+
+elapsedTime = time.time() - startTime
+m, s = divmod(elapsedTime, 60)
+h, m = divmod(m, 60)
+print 'Total script run time: ', '%d:%02d:%02d' % (h, m, s)
@@ -0,0 +1,95 @@
+import json
+import requests
+import secrets
+import time
+import csv
+from datetime import datetime
+
+baseURL = secrets.baseURL
+email = secrets.email
+password = secrets.password
+filePath = secrets.filePath
+
+oldKey = raw_input('Enter old key: ')
+newKey = raw_input('Enter new key: ')
+
+startTime = time.time()
+data = json.dumps({'email':email,'password':password})
+header = {'content-type':'application/json','accept':'application/json'}
+session = requests.post(baseURL+'/rest/login', headers=header, data=data).content
+headerAuth = {'content-type':'application/json','accept':'application/json', 'rest-dspace-token':session}
+print 'authenticated'
+
+itemList = []
+endpoint = baseURL+'/rest/communities'
+communities = requests.get(endpoint, headers=headerAuth).json()
+for i in range (0, len (communities)):
+    communityID = communities[i]['id']
+    collections = requests.get(baseURL+'/rest/communities/'+str(communityID)+'/collections', headers=headerAuth).json()
+    for j in range (0, len (collections)):
+        collectionID = collections[j]['id']
+        if collectionID != 24:
+            offset = 0
+            items = ''
+            while items != []:
+                items = requests.get(baseURL+'/rest/collections/'+str(collectionID)+'/items?limit=1000&offset='+str(offset), headers=headerAuth)
+                while items.status_code != 200:
+                    time.sleep(5)
+                    items = requests.get(baseURL+'/rest/collections/'+str(collectionID)+'/items?limit=1000&offset='+str(offset), headers=headerAuth)
+                items = items.json()
+                for k in range (0, len (items)):
+                    itemID = items[k]['id']
+                    itemList.append(itemID)
+                offset = offset + 1000
+elapsedTime = time.time() - startTime
+m, s = divmod(elapsedTime, 60)
+h, m = divmod(m, 60)
+print 'Item list creation time: ','%d:%02d:%02d' % (h, m, s)
+
+recordsEdited = 0
+elementsEdited = 0
+f=csv.writer(open(filePath+'replaceKey'+datetime.now().strftime('%Y-%m-%d %H.%M.%S')+'.csv', 'wb'))
+f.writerow(['itemID']+['replacedKey']+['replacedValue']+['delete']+['post'])
+for number, itemID in enumerate(itemList):
+    replacedElement = ''
+    itemMetadataProcessed = []
+    itemsRemaining = len(itemList) - number
+    print 'Items remaining: ', itemsRemaining, 'ItemID: ', itemID
+    metadata = requests.get(baseURL+'/rest/items/'+str(itemID)+'/metadata', headers=headerAuth).json()
+    for l in range (0, len (metadata)):
+        if metadata[l]['key'] == oldKey:
+            replacedElement = metadata[l]
+            updatedMetadataElement = {}
+            updatedMetadataElement['key'] = newKey
+            updatedMetadataElement['value'] = unicode(replacedElement['value'])
+            updatedMetadataElement['language'] = unicode(replacedElement['language'])
+            print updatedMetadataElement
+            itemMetadataProcessed.append(updatedMetadataElement)
+            provNote = '\''+oldKey+'\' was replaced by \''+newKey+'\' through a batch process on '+datetime.now().strftime('%Y-%m-%d %H:%M:%S')+'.'
+            provNoteElement = {}
+            provNoteElement['key'] = 'dc.description.provenance'
+            provNoteElement['value'] = unicode(provNote)
+            provNoteElement['language'] = 'en_US'
+            itemMetadataProcessed.append(provNoteElement)
+            elementsEdited = elementsEdited + 1
+        else:
+            if metadata[l] not in itemMetadataProcessed:
+                itemMetadataProcessed.append(metadata[l])
+    if replacedElement != '':
+        recordsEdited = recordsEdited + 1
+        itemMetadataProcessed = json.dumps(itemMetadataProcessed)
+        print 'updated', itemID, recordsEdited, elementsEdited
+        delete = requests.delete(baseURL+'/rest/items/'+str(itemID)+'/metadata', headers=headerAuth)
+        print delete
+        post = requests.put(baseURL+'/rest/items/'+str(itemID)+'/metadata', headers=headerAuth, data=itemMetadataProcessed)
+        print post
+        f.writerow([itemID]+[replacedElement['key']]+[replacedElement['value'].encode('utf-8')]+[delete]+[post])
+    else:
+        print 'not updated', itemID
+
+logout = requests.post(baseURL+'/rest/logout', headers=headerAuth)
+
+elapsedTime = time.time() - startTime
+m, s = divmod(elapsedTime, 60)
+h, m = divmod(m, 60)
+print 'Total script run time: ', '%d:%02d:%02d' % (h, m, s)